Gene Hhal_1906 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1906
Symbol
ID	4710807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2099951
End bp	2102032
Gene Length	2082 bp
Protein Length	693 aa
Translation table	11
GC content	72%
IMG OID	639856379
Product	TonB-dependent receptor
Protein accession	YP_001003472
Protein GI	121998685
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACCC ATGAACCAAC GGCTGTGCGC CTGTTAGGCG CCCTGCTGGC TGCGGCGGTC 
TCGGTACCGG CCGGGGCCGC GGAGGAGGGC GATGAGCACG CGTCCTCCAC CAGCCTCTCG 
CCGGTGCGCA TCGAGGCCGG CGGCGATCCC CTGGGCCGCG GCGTGGCCAG CGAAGCCCTG 
CAGCGCCGCC AGGCCTCGAG CAGCGCCGAG ATCTTCCGCG GCGAGGCCTC GGCCGGGGTC 
GGCGGTGGCA GCCGCAACGC GCAGCGGCTC TACCTGCGCG GTGTCGAGTC CAACAACCTC 
AACGTCACCG TGGACGGGGC CCGCCAGGGG CGGGACCTCC ACCAGCACCG CGGCGGCCTC 
ACCGGTCTGG ACCCGGATCT GCTGCGGGCG GCCGATCTCG ACCCGCGTCC GGCGGCGGAC 
CAGGGCCCCG GTGCGCTGGG CGGTTCGGTG CGCTTCGAGA CGGTGGACGC CCAGGATCTG 
CTCGACCCCG ACGAAGAGAC TGGGGCCCGC CTGCGCGCCG GCTACGCCAG CGCCGACGAG 
GCCGAGCGCG GCTCGGCCAC CGCCTTCGGC CGGCTGGGCG GCGACTGGGG CGCCCTGGCC 
CATATCGGTG CGGTCAACCG GGACGACTAC CGGGTCGGCG GCGGCGACAC CATGCCGTAC 
TCCGGCGGGC GCGATCGCGA CTACCTGGCG CGCATCAGCC GCGTGCCGGC ATCGGGCCAT 
CAGCTGCGTC TCGGCGTGCA GCGCAACACC TTCGAGGGGG ATCACCATTA CGGCTCCTGG 
GGCAGTGACT TCGGTGATCC GAGCGAGACG ACACGCCAAG ACCCGGTGGG CCAGGAGCAG 
CGCCGCGACA CCTGGACCGC CGAGCACCGC TACCGCCCGG CCGACCCCCA CGTGGACTGG 
CAGGCCCGGG TCTACCGCAA CGACAACCGC CTGGAACGCC AGGACGACAA CACCACCACC 
CGCGCCGTCG AGCAAGGCGG CGACCTGCGC AACACCTTCA CCCTGGACGC CGGGCCGACC 
CGTCACCGGC TCACCGCCGG TTTCGACTAC TACACCGAGG ACGGGCGCAG CGACCCCCAC 
GGAGGCGGCT CGAGGCTCAG TCACCAGTCG CGCAACTTCG GCGCCTTCGT GCAGAACCGC 
ATGGCCTGGG AGCGGTTGCG CCTCTCCGCC GGGCTGCGTT ACGACGACTA TGTCACCGAC 
CTGCAGGAGG AGACCCTCCA AGGCGATGCC GTCTCGCCCA ACTTCAGTGC GGAGTACGAC 
CTGACTGCCG GGTGGACCGC CTTCGCCGGC TACGGCGAGG CGGTCAGTGG CGCCGGGATC 
CTGCCGATCG GCTGGCTGGC CTACATCGAC GACGAAGAGA CCAATCTGAA TGACGGCGAG 
CCGTTCGAGG CCGAGGAGTC CCGCCGGCGC GAGGGCGGCC TGCGCTACCA GGGGCGGGAT 
CTGATCACGG CCCGGGACCG CTTCGACTTC GAGGCGACGC TCTTCGAGAC GCGGATCAAA 
AACAGTGTTG AGCGGGATGA CCCGTGGGGC ACACCGCACC AGCACAACCT GCCGCCCGAT 
AGGCGACATG ACGCGTTCTG GGATGAGGAC GCCCCGCTGG TTGGGGGCGT CCGCAACCGC 
CCCGATCCGG TCCGCCTGCG CGGCTACGAA CTGCGCGCCG CCTGGGGCGT GGGCCCCTAC 
GACGCCCGGC TTTCGTTCCT CAGCGCCGAG GCCGTGGACG ACGACGGCGA CCCGGTGGGG 
GTGATCCGGC GCCTGGGTGG GGGCGGCGGT GACCGTCTGG TCTTCGATCA GCGCTGGGCG 
GCCCACGAGA CCCTGACCCT GGGCTACACG CTCACCTGGG TGGGGGATCA CACCGACGTC 
CCCGACGACG AGCCGGAGCG CGACGGCTAC CAACTCCACG ACGTGCAGGC CGAGTGGCAG 
CCGTGGGCCG ACGACCGCCT GACCCTGGCG CTGGCGGTGA ACAACCTCTT CGACGAGCAG 
TACGCCGAGC ACACCTCCCT GGCGGTGGAG GAGAACGACG AGTGGCAGAT TCGCGACGAG 
CCCGGCCGGG ACGTTCGGGT GACCGGCACC CTGCGCTTTT GA

Protein sequence

MNTHEPTAVR LLGALLAAAV SVPAGAAEEG DEHASSTSLS PVRIEAGGDP LGRGVASEAL 
QRRQASSSAE IFRGEASAGV GGGSRNAQRL YLRGVESNNL NVTVDGARQG RDLHQHRGGL 
TGLDPDLLRA ADLDPRPAAD QGPGALGGSV RFETVDAQDL LDPDEETGAR LRAGYASADE 
AERGSATAFG RLGGDWGALA HIGAVNRDDY RVGGGDTMPY SGGRDRDYLA RISRVPASGH 
QLRLGVQRNT FEGDHHYGSW GSDFGDPSET TRQDPVGQEQ RRDTWTAEHR YRPADPHVDW 
QARVYRNDNR LERQDDNTTT RAVEQGGDLR NTFTLDAGPT RHRLTAGFDY YTEDGRSDPH 
GGGSRLSHQS RNFGAFVQNR MAWERLRLSA GLRYDDYVTD LQEETLQGDA VSPNFSAEYD 
LTAGWTAFAG YGEAVSGAGI LPIGWLAYID DEETNLNDGE PFEAEESRRR EGGLRYQGRD 
LITARDRFDF EATLFETRIK NSVERDDPWG TPHQHNLPPD RRHDAFWDED APLVGGVRNR 
PDPVRLRGYE LRAAWGVGPY DARLSFLSAE AVDDDGDPVG VIRRLGGGGG DRLVFDQRWA 
AHETLTLGYT LTWVGDHTDV PDDEPERDGY QLHDVQAEWQ PWADDRLTLA LAVNNLFDEQ 
YAEHTSLAVE ENDEWQIRDE PGRDVRVTGT LRF