Gene Haur_2087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2087
Symbol
ID	5733975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2598983
End bp	2600722
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	51%
IMG OID	641279228
Product	ABC transporter related
Protein accession	YP_001544855
Protein GI	159898608
COG category	[V] Defense mechanisms
COG ID	[COG1132] ABC-type multidrug transport system, ATPase and permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTTTC CGCTAGCGCG TTATCGTCGT TTACTGGCAA CCTATCTCAA GCCACAGCGT 
GGGCGGGTGC TCGGCTTAGG ATGCTTGGTT TTTCTGGGCA TTGGCTTGCA ATTGCTTAAT 
CCGCAAATTA TGCGCCGATT TTTAGATTCG GCGCTCGCTG CTCAACCTTT GGAGCAACTG 
ACCAAACTGG CATTACTCTT TATGGGTATC GCCTTTGGAC AACAACTTTT AGCGCTCGGT 
GCGGTTTATC TGAGCGAGCA AATTGGCTGG ACCGCAACGA ATGCCTTACG TGCCGATTTG 
ACCGCCCATT GTCTGCACTT GGATAGTAGT TTTCACAATC ACAAAACACC AGGCGAGCTA 
ATCGAGCGCA TCGACGGCGA TGTTACGACC TTAGCCAACT TTTTTACCCA GTTTATTATT 
CAATTGCTGG GCAATGGCTT GTTGCTGCTG GGGATTATTG TGGCCTTGGC CTTGGAAGAT 
TGGCGGGTTG CAGTTGGGCT AATCGTCTGT GTGGCAGCGG CGATCAGCCT GTTGCAAAAA 
ATGCAACGGG TTGGCGTACC ACTCTGGGGC GAATCACGCC AAGCGAGTGC TGAGCTGTTT 
GGCTTTTTAG AAGAACGCTT GGCGGCAACC GAAGATATTC GCTCAAGCGG CGCACGCAAT 
TATGTGATGC AACAGCTCTA TCGCCAAATG CTCGTGCTCT ATCGCAAAAC TCGTAAAGCT 
GAGCTAGCCA CCGCTTGGCT CTATAACGCT GGCCAATCGA TGTTTATTAT CGCCAGTGGT 
TTGGGTTTGG GCATTGGTAT CTACCTGTAT CAACAGCAAC AAACGACAAT TGGTGGCGTG 
TATATCATCA CAGCCTATAT TGGCTTGCTC ACCACGCCGC TCGAGCAAAT TTTACGCCAA 
ATTCAGGAGT TTCAAAAAGC CAGTGCCGGC ATTTTGCGCA TCGATGAATT GCGCCAGCAG 
CGACCAGCAA TCGTTGATGG CACTGGCCCG ACAATCCCGC AACAAGCACT TGATCTGCGG 
TTTGAGCAAG TTTCATTTGG CTATAACACC GATACGCCAG TCTTGCGAGC GCTTTCGTTT 
GAATTACCCG CCCACCAGAT TTTAGGCGTA TTGGGACGGA CTGGTAGCGG CAAAACGAGC 
CTGATTCGGC TTTTGTTACG CTTGTATGAT CCGCATCAAG GTACAATTCG CTTAGGCGGC 
ATCGATATTC GCAACACCAG TTTAGCCGAT TTGCGCCGCT CGATTGGCTT CGTGAGCCAA 
GATGTGCAAC TATTTCATGC CAGCGTTCGC GATAACCTGA GCTTTTTCGA TCACAGAATT 
GCTGATCAGC AATTGCTGGC TGCCTTAGAA ACCCTCGGCC TCACCAACTG GCTTAACAGC 
CTTGAACATG GCCTCGATAC GCTGATCAAG CCAAATGGGC TTTCGGCGGG TCAGGCTCAG 
CTCTTGGCAT TTGCGCGAAT TTTGCTAAAA GACCCACGAT TAATTATCCT CGATGAGGCT 
TCATCACGGC TTGACCCAGC GAGTGAGGCG ATTGTCGAAC GCGCCTTAGA TCGGCTGTTG 
GCAGGTCGCA CCGCAATTAT CATTGCCCAT CGGTTGGCAA CCTTACAACG CGCCGATGCG 
ATTTTAGTGC TCGATGCTGG CACAATTCGT GAGTTTGGCC CACGCCAAGC ACTGTTACAA 
AACCCTCAAT CGCAGTATAG CCAACTGTTG CAACATGGCA TAACCGAGGT GTTCGCATGA

Protein sequence

MQFPLARYRR LLATYLKPQR GRVLGLGCLV FLGIGLQLLN PQIMRRFLDS ALAAQPLEQL 
TKLALLFMGI AFGQQLLALG AVYLSEQIGW TATNALRADL TAHCLHLDSS FHNHKTPGEL 
IERIDGDVTT LANFFTQFII QLLGNGLLLL GIIVALALED WRVAVGLIVC VAAAISLLQK 
MQRVGVPLWG ESRQASAELF GFLEERLAAT EDIRSSGARN YVMQQLYRQM LVLYRKTRKA 
ELATAWLYNA GQSMFIIASG LGLGIGIYLY QQQQTTIGGV YIITAYIGLL TTPLEQILRQ 
IQEFQKASAG ILRIDELRQQ RPAIVDGTGP TIPQQALDLR FEQVSFGYNT DTPVLRALSF 
ELPAHQILGV LGRTGSGKTS LIRLLLRLYD PHQGTIRLGG IDIRNTSLAD LRRSIGFVSQ 
DVQLFHASVR DNLSFFDHRI ADQQLLAALE TLGLTNWLNS LEHGLDTLIK PNGLSAGQAQ 
LLAFARILLK DPRLIILDEA SSRLDPASEA IVERALDRLL AGRTAIIIAH RLATLQRADA 
ILVLDAGTIR EFGPRQALLQ NPQSQYSQLL QHGITEVFA