Gene Cag_1014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1014
Symbol
ID	3746742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1356053
End bp	1357996
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	41%
IMG OID	637773543
Product	TonB-dependent receptor-related protein
Protein accession	YP_379319
Protein GI	78188981
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4206] Outer membrane cobalamin receptor protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAA AAGTATTTGT GGTTGTCATG GCGGGTTTGC TATGCAGCAA GGGGCTTATG 
GCGGCTGATG GGCAGCCGAT GAGCGTTATG GGTGAGGAGA TGGTGGTTAC TTCAAGCCGT 
TTTGAGGAGC CAAAGAAAAA TCTCACATCG AACATTACCA TTATCGGTAA AGATGAGATT 
GCTCAATCGT CGGCTCAAGA TTTGGGGGAA TTGTTGGCTG AAAAAAATCT TGGGCAAGTT 
CAGAAATATC CCGGCACGAT GACTTCGGTT GGTATTCGAG GTTTTAGAAG TGAAACGCAT 
GGCAACGATT TAATGGGTAA AGTTTTAGTG CTTATTGATG GTCGGCGTGC AGGTACGGGC 
AATACGGCTA AAATTATGAC CGAGAATGTT GAGCGTATTG AAATTATTCA AGGTCCAGCG 
GCAGTGCAAT ATGGTTCAGC CGCAATAGGT GGAGTAGTAA ATGTTATTAC TAAAAAAGGC 
GATAATGTAC CTTCATTTTT TGTAGAACAA AAAGGGGGAA GCAATGAATT TGTGAAAACG 
GCTGCCGGTG TGCAGGGCAA AATTGGTAAG CTTGATTTTG CAAGTGCCCT TTCGCGCTCT 
GAAGCTGGTG ATTATAAAAC GGGTTCTGGT AAAACATATT TTAATACGGG ATATGATGAG 
CAGGTTTTAG CTAATCTTAA TGTTGGCTAT GAAATTGCTG ATGGGCATCG TATCGGGTTT 
GGATATCATT CATTTGATGT AGATAAAGCT GGATCGCCAT CATATCTTAG CCTGAATGAC 
TTACAAAGTT ATACAAGCAA TAACAATCAT GCTATTGATG TTAGCTATGA AGGTGCTCTT 
ACCAATAAAC GTTGGTTATG GTCAACTCGC TATTTTAGTG GTATGGATAG CTATCAATAT 
GTTGATCCAT CAACTTCTTA TACAAGTTCG AGTGATGTGG AACAGCAAGG TGCTCAAGCG 
CAAATTTCAT TTACCGAAAA GAGCTTGCTT ATAACGGCTG GAGTTGATTG GCTAAATTAT 
GAATTAACCT CAACGTTAGC CCCTAAGTGG AGTAAATACA ATAACCCAGC CGTTTTTTTG 
CTTGCTAAAT ATGGAGTGTT TGAGGATCGG CTTTTGCTTT CGGCTGGTGT TCGCTATGAT 
GATTATAAGG TTGATTTACA ACCTGCGGAA GGCACCTCGC GTAGTACGGA TAATTTTGCC 
CATCAAGTAG GAGCTGCATG GCAAGTGAAT GATGTTGTAA AACTACGCGC TTCTTATGCC 
GAAGGTTTTA GAATGCCATC GGCACGTGAA CTTGCTGGAA ATATTGTGTC GTTTGGTAAA 
ACTTATATTG GAAATCCTAA TTTAAACCCT GAAGTTAGCG AAACATGGGA AACAGGTATT 
GATGTTGTAT GGAGAGAGAT TACATCATCA CTTACATGGT TTTCAACCGA TTACACCGAT 
ATGATTGAAA CCCAGCTCAC TGCTCCTAAA ACATATCTCT ATAAAAATAT TGGTAGTACT 
TCGTTGTCGG GTATTGAAGC TGAATTTGCA TGGAAAAGTT CTGCAACTAC TTGGAACATT 
GAGCCTTACG TAAACTACAG CTATCTCTTA GAGCATAAAG ATAATGCTAC GGGCGATGAT 
TTGCTTTATA CCCCTGAGTG GAATGCCAGC ACAGGAGTGC GTCTTCAGCA TACGAATGGC 
TTAAGTGCTG CACTGAATGT TACCGCAACG GGTAGTAGTA ATGTGCAAGA TTATGAAAGC 
AATTCAGGTA AAGTGATTAC GAAGGGTGGC TTTAGTGTTG TAAATCTTTC AGCATCGAAA 
AAATTTACGC TTGATAAACA AGAGCGTCGT GCTATTACTA TAAAAGCTGA GGTTGATAAT 
TTGCTTGATC GCGATTATCA ATACGTTAAA GGTTATCCCA TGCCCGGACG CACGTTTGTG 
ATTGGGTTGC GTGCCGACAT CTAA

Protein sequence

MNKKVFVVVM AGLLCSKGLM AADGQPMSVM GEEMVVTSSR FEEPKKNLTS NITIIGKDEI 
AQSSAQDLGE LLAEKNLGQV QKYPGTMTSV GIRGFRSETH GNDLMGKVLV LIDGRRAGTG 
NTAKIMTENV ERIEIIQGPA AVQYGSAAIG GVVNVITKKG DNVPSFFVEQ KGGSNEFVKT 
AAGVQGKIGK LDFASALSRS EAGDYKTGSG KTYFNTGYDE QVLANLNVGY EIADGHRIGF 
GYHSFDVDKA GSPSYLSLND LQSYTSNNNH AIDVSYEGAL TNKRWLWSTR YFSGMDSYQY 
VDPSTSYTSS SDVEQQGAQA QISFTEKSLL ITAGVDWLNY ELTSTLAPKW SKYNNPAVFL 
LAKYGVFEDR LLLSAGVRYD DYKVDLQPAE GTSRSTDNFA HQVGAAWQVN DVVKLRASYA 
EGFRMPSARE LAGNIVSFGK TYIGNPNLNP EVSETWETGI DVVWREITSS LTWFSTDYTD 
MIETQLTAPK TYLYKNIGST SLSGIEAEFA WKSSATTWNI EPYVNYSYLL EHKDNATGDD 
LLYTPEWNAS TGVRLQHTNG LSAALNVTAT GSSNVQDYES NSGKVITKGG FSVVNLSASK 
KFTLDKQERR AITIKAEVDN LLDRDYQYVK GYPMPGRTFV IGLRADI