Gene Haur_1898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1898
Symbol
ID	5733787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2290916
End bp	2291902
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	49%
IMG OID	641279042
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001544669
Protein GI	159898422
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGTCA ATTTTATCTT CTTCTTAATC AAACGCTTGG CGATGATGGC AGTTTCGCTG 
GTGGTGATTA TTGCAATCTC CTATACGCTG CTCGCCAAAG CCCCAGGCAA TTTTATGGAT 
GTCCAGCGAG CGGTGGCCGC AATGACCACG CTGGCCAATA GCAACAGCGA GACCTTCAAA 
ATTCAAAAGG CGCTCTTTGA TGAACGCTAT GGCCTCGATA AACCACTCTA TATGCAAATT 
TGGACTTACA CCAAAAATGC TGTTACCTTC GATTTTGGCC CCTCGTTTCA AAGCCCAAGT 
ATTTTGATTC AAGATATGGT GCGCGAACGC TTGCCGCGCA CGTTGTTGAT CGTCTTCCTC 
GGGATTGGCC TCGCATTAAT TGTGGGGATT CCGCTCGGGG TAATTGCTGG TTTTCGCCGC 
AATACTTGGA TTGACTATAT CGTGACCGGC TTTTCGATGA TCGGCCAAGT CGTGCCCGTG 
TATGTTTTGG CAATTGTGCT GATTCTGATT TTTGCGGGGC AAGTTTGGAA TGTGCTACCA 
AATGGTGGTT GGGCCACACC CGTGCCAACC TTCAAGCAAT TGATTTTGCC AGTGCTAACC 
TTGGCACTTG GGCCAATTGC TGGGATTGCC CGCTTTACCC GCAACCAAGT TGCTGAAACC 
ATGAGTCAAG AATTTATTCG TACTGCTCGC TCAAAAGGTA TCTCCGAGCG CTTGGTGATT 
ATGCGCCATG CCCTTCGTAA CTCCTTGATT CCTGTGGTAA CAACCACTGC GCCGCAAATT 
GCCTATGCGT TGGTTGGCTC GGTGTGGATT GAAAATATTT TTCGGATTCC AGGGATTGGC 
CAATTGTTTG CCACCGCGCT GGGTGCACGC GATTACCCCT TGGTAATCAC CAGCACGGTT 
ATTTTGGCCC TTGGGGTTAT GTTGGCCAAT TTATTAGCCG ACATCCTGTA TAGCATCCTT 
GATCCGCGGA TTAAGCTCGA AGCCTAA

Protein sequence

MRVNFIFFLI KRLAMMAVSL VVIIAISYTL LAKAPGNFMD VQRAVAAMTT LANSNSETFK 
IQKALFDERY GLDKPLYMQI WTYTKNAVTF DFGPSFQSPS ILIQDMVRER LPRTLLIVFL 
GIGLALIVGI PLGVIAGFRR NTWIDYIVTG FSMIGQVVPV YVLAIVLILI FAGQVWNVLP 
NGGWATPVPT FKQLILPVLT LALGPIAGIA RFTRNQVAET MSQEFIRTAR SKGISERLVI 
MRHALRNSLI PVVTTTAPQI AYALVGSVWI ENIFRIPGIG QLFATALGAR DYPLVITSTV 
ILALGVMLAN LLADILYSIL DPRIKLEA