Gene Haur_3800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3800
Symbol
ID	5735664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4770873
End bp	4771904
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	54%
IMG OID	641280952
Product	inner-membrane translocator
Protein accession	YP_001546564
Protein GI	159900317
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4177] ABC-type branched-chain amino acid transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCGTT TGCGCCCACT ACTGCCACTT GTGGCGATTG GCGGCCTTGC AAGCTTGCCA 
TTTGCCTTTG CCGCCGATAC CACCCGCTTT TGGCAAGGGG TTTTCATTCA GATTTTTATT 
CTGGCGATTT ATGCCCTGAG CTACGATTTG CTGATGGGCT ACACCGGCAT GATTTCGTTT 
GGCCATGCGC TGTTTTTTGG CGCTGGTGGC TATACCGCCG CCATTTTGCT GCGCCAAGCC 
GAGCCGCCCT CGATGCTAAT TGTGATTGCA GCGGTGATTG TGGTTGGCGC AACTATCGGG 
GCAGCAGTGG GCGCATTGTC GCTACGGGTC AGCGGGGTCT ATTTTTCGAT GATTACCCTC 
GCGCTGGCCG AAATTGCCTT CATCCTGTTC AAAGCCGATG ATCCCAAGCT CAAGCCAATT 
ACGGGCGGCG AAATTGGCTT GCAAGGGATT GTCGTGCCCG CAGCGATCGA TGCCACGACC 
TATCGACTGC GCTTTTACTT TTTGACCTTG GCGTGTATGG TTGGCTTGTA TTACGCGGCG 
CGGCGTTTGA TCAACTCGCC AACAGGGCGG GTATTTGTGG CAATTCGCGA GAACGAGCCA 
CGCGCCACGG CCTTGGGCTA TAACACGCTG CATTTCAAAT TATTGGCAAC TGCAATTTCA 
TCAACGATTG CGGCCTTGGC AGGGATGTTG ATGGTGCTGT ATGAAAAAAG TGCCAGCTTC 
GAAATGCTCA GCGTTAATCT CACCATTCAA GCCTTGTTGA TGACGATCAT CGGCGGGATT 
GGCACGCTAA TCGGGCCAAT GCTCGGTGCT GCTACCATCC GCTTGCTTGA TCATGGCCTC 
AAAGGCGAAT TTATGCAGGC ACTTTTGCCA GCGTGGTTGC GCCCCGACTT AGTATTTGGC 
ATCGTGTATG TGGTGCTGGT GTTATTCTTC CCGGCTGGTT TGATGGGAGC AATTCGCAAG 
TTGCGCGGCA AAACCAGCCG TAGCTCAGTC GAACGCCTAC GCCAAGCCAT GAAACCAAAG 
GCTGAATCAT GA

Protein sequence

MQRLRPLLPL VAIGGLASLP FAFAADTTRF WQGVFIQIFI LAIYALSYDL LMGYTGMISF 
GHALFFGAGG YTAAILLRQA EPPSMLIVIA AVIVVGATIG AAVGALSLRV SGVYFSMITL 
ALAEIAFILF KADDPKLKPI TGGEIGLQGI VVPAAIDATT YRLRFYFLTL ACMVGLYYAA 
RRLINSPTGR VFVAIRENEP RATALGYNTL HFKLLATAIS STIAALAGML MVLYEKSASF 
EMLSVNLTIQ ALLMTIIGGI GTLIGPMLGA ATIRLLDHGL KGEFMQALLP AWLRPDLVFG 
IVYVVLVLFF PAGLMGAIRK LRGKTSRSSV ERLRQAMKPK AES