Gene Haur_4060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4060
Symbol
ID	5735918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5184765
End bp	5185979
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	47%
IMG OID	641281211
Product	hypothetical protein
Protein accession	YP_001546820
Protein GI	159900573
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000137982
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGCCAA AAACACCAGA ACCAATCATC AAAACAATCC CATCTTGGCG CGATTTAGCC 
CGTTGGACAA TCACCGCATT TGCGATTTGG CTGGTGGCGT GGTTGCTTTG GCGCACGGGA 
AATCAGCTCT TGCCGTTTGT AGTTGGTTTG GTGTTTGCCT ATTTGCTCTT GCCCTTGGTC 
AACAAGTTAG AGCGCTGGAT TCCGCGCTGG GCCGCGATTT TGGTGGTCTA TATAGTTGGC 
TTGGGAATTG TAACAGGCTC GATTCTCTAT ATTGTGCCGC CTGCAATCGA CCAAGTGAAT 
GGGTTTGGTA AATCATTGCC TGAATTTTAT AAAAACACCC TCGAACCCAA AATCAATGAA 
GGTCTAAAGT GGTATCGGAG CGAAGTGCCC GACGAGATTC AAGAAGATAT TGATAAGCAA 
GTGAGTAAAG GCATCACTAC ACTCAAAGAA AATGCTACTA ATTATGTTGA AACAGGCGTG 
AATGGAATTT TGAATGGCTT GGGGGTGATT TTTCAAACAA TTATCTTCCT CGCAGGCTTT 
TTGATTATTC CATTTTGGCT GTTTTATGTG CTGCTTGATG AACGCAAAGG CAAGGCAGCC 
CTGATTCGCA TGATTCCCAA AGCGGTGCGA ACCGATGTAT TGACCGTGCT ATCGATTTTT 
GATCGGGTGT TTTCGGCTTA TATTCGGGGC CAATTAACGC TTGGCTTGAT TATCGCAATT 
ATGTCGTACA TTGGCTTGTG GATTGTTGAT TTGGTGATGC CTGGCGAAAT TCCCTATAAA 
TTGCTGTTGG CCTTGGTTGC AGGCTTCACC GAATTAATTC CGGTGATTGG GCCGATTATT 
GGGGCAATTC CGGCGGTAAT TGTTGGCTTA ACCACCTCGT TGCCAATGGG CTTAGTCGTC 
GCTGGCTTGT ATATTGTGAT TCAGCAAATT GAAAATAATT TCCTTGTGCC ACGGATTATC 
GGGGCAATTG TGGAAATTCA TGAAGCAGTT TTGATGCTGC TGTTGGTGAT TGCTGGTACA 
GTTTCGGGCT TGCTTGGGGT AATTATTTTC GCCCCGATGG CGGCAGTGGC CCGCGATAGC 
TACCAATATA TCACTGGTCG CTTGCGCCAA CCCAACGATC CACGCTATTT GCGAGCTGGC 
GAGTTGCCGT GGGAACATAA AGAAGAACCT GAAACGCCGA TGCCGCCGAT GTTGGCTTTG 
CAAAATAAAG CCTGA

Protein sequence

MEPKTPEPII KTIPSWRDLA RWTITAFAIW LVAWLLWRTG NQLLPFVVGL VFAYLLLPLV 
NKLERWIPRW AAILVVYIVG LGIVTGSILY IVPPAIDQVN GFGKSLPEFY KNTLEPKINE 
GLKWYRSEVP DEIQEDIDKQ VSKGITTLKE NATNYVETGV NGILNGLGVI FQTIIFLAGF 
LIIPFWLFYV LLDERKGKAA LIRMIPKAVR TDVLTVLSIF DRVFSAYIRG QLTLGLIIAI 
MSYIGLWIVD LVMPGEIPYK LLLALVAGFT ELIPVIGPII GAIPAVIVGL TTSLPMGLVV 
AGLYIVIQQI ENNFLVPRII GAIVEIHEAV LMLLLVIAGT VSGLLGVIIF APMAAVARDS 
YQYITGRLRQ PNDPRYLRAG ELPWEHKEEP ETPMPPMLAL QNKA