Gene Hhal_0387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0387
Symbol
ID	4711457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	451339
End bp	453390
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	67%
IMG OID	639854850
Product	TonB-dependent receptor
Protein accession	YP_001001983
Protein GI	121997196
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.84983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACCCGA GACAAATCCG CACCATCCGG CCGCTGTTCA CGTACTCCAG CCTGGTCGCG 
CTCGTTACAC TCAGCGCGGC GGTCAAAGCC GATGACCCCC CGGCGGAACT GCCGGAGGTC 
TTGGTCGAAC CCCCCGAGGA GACGGAAGGC AGCGGCACCG AGCGGAGCGC ACGCCAGCAA 
TCCCATCGCC TGCACGACCT CTTCCGTGGG GATTCCGAGA CCCACGTCAG CGGCCCGCGG 
CAGGCCCAGC GCCTCTATCT GCGCGGCATC GAGGGCAGTC AAACCCAGAT CACCATCGAC 
GGCGCCCGCC AGGGCCGCGA CCTGCACAAC CACCGCGGCG GCCTGAGCGG GATCGACCCC 
GCCTTCCTGC GCCGGGCTGA TGCCGAACCC GGTCCGCCGG CGGCCGATGA CGGCCACGGG 
GCCACCGGAG GCTCCGTGCG CTTCGAGACC ATCGACGCCG GCGACCTGGT CGATCCCGAG 
ACCGGCTACG GGGGCTTCGC CCGCGGCGTT CGGGGCAGCG CCGCCGATTC CCTGACCACC 
AGCGCCGCGG GCGCCATCCA ACCCACGGAT CGCGTCGGCC TGCTGGTCGG GGGCAGCTAC 
ACTTCATTGG ACGATTACCG CGTCGGCGGC GGGGATATCA AGGAGTACAC CGGCTACGAC 
GACCGCAACC TGTTGCTGCG GCTCAACGCC GACGACGGCC ACAACCAACG GGTCCGCCTC 
GGCTACGAGG AAAACGAGAA CCGGGGGGAA CTGCCAATGA ATGCCGGCGA CCGGGTCCGG 
GGCGCCGATG GGCACATCCG CGAGGACGAC ATCGCCGACC AGCGCATGGT GCGGGAGACC 
ACCAGCCTCA ACTACGAGTA CCACCCGGAA ACGCGGTGGG TCGGCCTGGA GTTCGACCTC 
TATCGCAACA AGAGCGAATG GGAGAATCGC GACGACGATA CCGGTTTCCT CAGCGACGGC 
GTCGGCGGCC GCCTGGCCAA CACCGCCACC CTGGCACGGG GCTCACTCGG TCCCCTGGGC 
CACAGTGAGA ACCGCCTGAC GGTCGGCGGT GACCTGTACC AGGACACGGG TGAGGCGGAC 
CACGGAGACA TCCTGACCTA CGACGCTCAG GGGCTGTTCG TGCAGAACCG GCTGGAGAGC 
GAGCGACTGG ATCTATCCTT CGGGTTGCGC GGCGACTGGA TGGAGACCGA CTACGAGCAA 
CCCGGCGAGT CGGTGGATTT CTCGGAACTC TCCACCAACG CCCGCATCGG CTACTGGGCC 
ACCCCCTCCA CGGAGATCTT CGCCGGCTAC GGCGAGTCCG CCCAGGGCCG CTCCGAGACG 
GTCGCACTGC ATTTGGACCG CAACATCGAC ACCGAAACGC GGATCGACTA CGACGAGCCG 
CAGACCAGCA CCACGGCGGA GGCCGGCATC CAATCCGAGC AACCGCTGGC CGGAGGCTAT 
CTGGAGCTGT CGGGCACCCT GTTCCGGACC GACATCGACG ATCTGATCCT CTACGAGTAC 
GAGCGGCCGA CGAACCTGGG ACGACAAACG CCTCAGAGCG TCTACAACCT CGACGAACAG 
ATCACCACGG AGGGCTATAC CCTCAAGGCA GCGTGGCGGG GGGAGGACCT CTACAGCGCA 
TTGAGCTTCA CCCACGACAA GGTCCGCGGC CTCGACAGTG GCAATGCGCT AGGTACCAGC 
CGCCCCGATG CACGTCAGCA GCTGGTTCGG ACGGTCGGCC CGCAGGGCGA CCGCCTCGTC 
TGGGACAACG TCTACCAGCT CCACCCCGCC TTCCAAGTGG GCTACACCCT GAAGATGGTC 
GCCGATCTGG AGCGGGTGAT CCCCGGGGAT GGAGAACGTG ACGGCTACAA CATCCACGAC 
GTGCAAATGC GGTGGCAGCC CCCGGGCGAG ACGGATGTCA CCGTTTACTT CGTAGTCCAC 
AACCTGTTCG ATGAAGAGTA CGCCGGCCAT ACGGCGATAC CGCAGTACGA AGCCGGAGAG 
ACCGTGGCGG ACAGTGACTA CCTGCGGGAG CCGGGACGGG ACATGCGCCT CGGCGCCAAG 
GTGCAGTTCT AG

Protein sequence

MHPRQIRTIR PLFTYSSLVA LVTLSAAVKA DDPPAELPEV LVEPPEETEG SGTERSARQQ 
SHRLHDLFRG DSETHVSGPR QAQRLYLRGI EGSQTQITID GARQGRDLHN HRGGLSGIDP 
AFLRRADAEP GPPAADDGHG ATGGSVRFET IDAGDLVDPE TGYGGFARGV RGSAADSLTT 
SAAGAIQPTD RVGLLVGGSY TSLDDYRVGG GDIKEYTGYD DRNLLLRLNA DDGHNQRVRL 
GYEENENRGE LPMNAGDRVR GADGHIREDD IADQRMVRET TSLNYEYHPE TRWVGLEFDL 
YRNKSEWENR DDDTGFLSDG VGGRLANTAT LARGSLGPLG HSENRLTVGG DLYQDTGEAD 
HGDILTYDAQ GLFVQNRLES ERLDLSFGLR GDWMETDYEQ PGESVDFSEL STNARIGYWA 
TPSTEIFAGY GESAQGRSET VALHLDRNID TETRIDYDEP QTSTTAEAGI QSEQPLAGGY 
LELSGTLFRT DIDDLILYEY ERPTNLGRQT PQSVYNLDEQ ITTEGYTLKA AWRGEDLYSA 
LSFTHDKVRG LDSGNALGTS RPDARQQLVR TVGPQGDRLV WDNVYQLHPA FQVGYTLKMV 
ADLERVIPGD GERDGYNIHD VQMRWQPPGE TDVTVYFVVH NLFDEEYAGH TAIPQYEAGE 
TVADSDYLRE PGRDMRLGAK VQF