Gene Clim_1019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1019
Symbol
ID	6355468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1116425
End bp	1118143
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	59%
IMG OID	642668642
Product	TonB-dependent receptor
Protein accession	YP_001943073
Protein GI	189346544
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4206] Outer membrane cobalamin receptor protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.463707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGGTG TCCGGGTTAT GCTGCTGGTT ATCGCGCTGA TCATGGGGGG CGTCATGCAA 
GGACGGCTCC TGGCGGCGGG CAACGACGAT ATCGTTGCCA TAAGCGCGTC CGAACTCGAA 
GCCACGGACG CCACGGATGT CGCCGAGCTG CTCAATCGCA TCCCCGGCGT CAAGGCGAGC 
GAATCGTCGG TCTCCATACG GGGCTCTTCC AACGTGAAGG TGCTGCTCGA CGGGCGGCCG 
ATAAACGATC CGACATCGCA TTCGGGATCG GTGAAATGGT CGATGATCTC CCTCTCCGGC 
ATCGAAAAAA TCGTGATCCA CAAAGGGAGG GGGAGCGTCT CGTACGGCGA CAATACGGAG 
GGCGGAGTTA TCGTCATCAC CTCGAAAAAG GCCAGCCGCA TAGGAGGAAT GGTCGGCGTC 
GGCGCCGGCA ATAACGGGGA AAAGCATGCC GATATCAACC TGCAGGGCCG TTTCGACCGT 
TTTGCCGCGA ACCTGACTGC GGGAGCGAAG GGGTACGACG GATTTACGGT CAACGACGAC 
AAGCGGGAGT ATCGCGCGGG GTTGCGTCTC GATTACGCTC CGCTTGAAGG CACCTCGCTG 
TTCCTTTCCG GCGACTATAG CACGCAGGAG AAGGGGATGC GGGGGTACCC CGGAAGCCGG 
ACGCCGAACG CCCGAATGGG GTACGACGAC TGGTCGCTGC TTTTCGGCGT CAGCCGCAAT 
ACCCTTGACG GGCGGGCCTG GTTCCGTAAA ACCCTGACGC AGAACAGCGA TTCCGACAGG 
GACTTCTTTT CCGGTCTGGA GGTGCTCTCT GCCGGCATGA GTGTAGACGG ACCGGTCAGC 
CTGCCCCTTG CCGGATCGCT GAAGGCCGGT TTCGGCTACG AATGGCAGTC GGCAAGCGGC 
AGCGGGTTCG GCGCGAAAGA GGAGCGGCGG GGCTGGCTTC ATCTTACCAG GCTTTTTCGG 
CAGAAGGATG GCCCGTGGTC GGCCGATGTC GGCATCCGTG AGAACATCTA CTCCGCTTTC 
CACAATACCC TGAATCCGGA GGTGAAGGTT GCGTGGAAAA GGAAGCCGTG GAGAGTGGAG 
CTGACGGCCG GCGAGACAAA TAACCTGCCG ACCTTCAGGC AGCGCTATAA CGAGACATCG 
ACCACCCGTC CCAATCCCGA TCTCGAGATG GAGCAGGCAT TGAACACCGG TTGCTCGGTG 
TCGTTCGCTC CCTCGGAAAA GCTCAGCGCC GAACTGTCGT TTTTTCATCG GGACATCACC 
GATCGCATCA CCTATGTGCG TGCTTCGGAC AATACCGGAA AGTACGAGAA TTTCGGAGAG 
GTCATCTATC AGGGAGTGGA GGCTTCGCTT TCCTGGAAAC CGTCGCCATG GATCGAGTTT 
ACGCCTTCGT ACCTGTATCT TCACGCCCGC AACGAAGAGA CCGGCCTCTG GCTGCCCGCC 
ACTGCCTTCC ACACCGTTTC GGGAGAGCTT CTCCTGAAAC CGGCAGCCGG GCTCTCCATC 
AGGACGGATG TGAAATATAC CGGGAAGGTT TTCGCGAGAA CCGACAACAC CGAGACCATT 
GCGGGTTATC TCGTGGCTGC TCTCAGGGTC GATTACCGGA CAGGAGCGGC GCAGTTCTTC 
GTCGATATCG ACAATCTGTT CGATATCGAA TATCTCTATG CCGACGGTTA TGATGCCCCG 
CCCCGCGAGT GGGAGATCGG CATGAATTAC ACCTTCTGA

Protein sequence

MNGVRVMLLV IALIMGGVMQ GRLLAAGNDD IVAISASELE ATDATDVAEL LNRIPGVKAS 
ESSVSIRGSS NVKVLLDGRP INDPTSHSGS VKWSMISLSG IEKIVIHKGR GSVSYGDNTE 
GGVIVITSKK ASRIGGMVGV GAGNNGEKHA DINLQGRFDR FAANLTAGAK GYDGFTVNDD 
KREYRAGLRL DYAPLEGTSL FLSGDYSTQE KGMRGYPGSR TPNARMGYDD WSLLFGVSRN 
TLDGRAWFRK TLTQNSDSDR DFFSGLEVLS AGMSVDGPVS LPLAGSLKAG FGYEWQSASG 
SGFGAKEERR GWLHLTRLFR QKDGPWSADV GIRENIYSAF HNTLNPEVKV AWKRKPWRVE 
LTAGETNNLP TFRQRYNETS TTRPNPDLEM EQALNTGCSV SFAPSEKLSA ELSFFHRDIT 
DRITYVRASD NTGKYENFGE VIYQGVEASL SWKPSPWIEF TPSYLYLHAR NEETGLWLPA 
TAFHTVSGEL LLKPAAGLSI RTDVKYTGKV FARTDNTETI AGYLVAALRV DYRTGAAQFF 
VDIDNLFDIE YLYADGYDAP PREWEIGMNY TF