Gene Cag_0873 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0873
Symbol
ID	3747334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1204936
End bp	1206639
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	39%
IMG OID	637773404
Product	TPR repeat-containing protein
Protein accession	YP_379181
Protein GI	78188843
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.127126
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAACG AGTTATTAGA TGAAAAGCTA AGGTTATTAG TAAAAGCATT ACGTGCCGAT 
ACGTTTCATT TTGTGCTTAT TATCAATAAC CATCCTTCCG TATATAACGA TGTGGTGGAG 
TGGTTAAAGC AGCATATCAC CGATCGTGAA ATAAGAGAGT TGCGTTTAAC AGGTAAACAT 
TATCGTGAGG TTTCGGATGT GTTACAAGCA GCAAAGCAAG ATATTGTAAC GATTCCTGAT 
TTTGATGAAC TTTTTACTAA AGAGAATGAT GATGTACGAG TTGCACTGAA TCAACGGAGA 
GATTTTTTAG CATTCCAGCG AATGAATTTA GTCTGCTTTC TTTCGCCCGA CACCTTTCGT 
TTACTGCCTA AAAAAATACC TGATTTATGG TCGTTGCGTT CGTTGGAACT TGATATTGCT 
TACGATATAA AAGAACCGCT TTTTACCATT CCAACAACGC CTTTTATTTC TTCACTTGGC 
GGAACAACCA TTGCTGAAAA AGAGGCTGAA ATCCGTCGCC TTACCTATCA ATTAAGCCAA 
ATTGATCCAG CAAACATTGC ACTTCGTAAA GAGCTTGAGG CGCAATTAGT AACGTTGCAA 
ATGGAGGTTC CACAACGTTT TGAGGAGGCG ACTTCCTTAC ACGATACATC GCAAAAAAAT 
ATTATTGCAG CAGAGGTTAC AGCTACTCAA GATGAGACAG TAACAAATAT TAGTACTTCT 
ATCCTTCGCT CTATTTTTGC AGTACTACCA TCCGAGCCAA TTACCTTAAT AGCGTTACAA 
GAGCTTTTAC CGAACATTGA TAATCTTGAA ACAGCATTAC AAAACCTTGT TGCTGAAAAC 
GTTCTCAATT ACAACTCAAC CACCAAAAGC TACAAATGCA GCCCCGTTGT GCAAGAAGTA 
ACTCGCAAGC AACAGAGCGA CCATTTATTT GCAGATATTG AACAGCTGAT TAGTAGGCTT 
ATTGATAGAC TTGCTTATGA ACCCAATACA GGGCATGTAA CCGAAGTTTC ATACGAAACC 
GCTGCGCTTT ACGTGCGTTA TGGGGAAACT ATTCTACGCA ATTGCACAGA TGTTGAATAT 
CAGCTTGCAG CTCTGGCAGA CAGAATAGGC AACTACCATA CTGCAACAGG TAACCTTGAC 
AAAGCTCTTT CTTTTCATGC AGAATGTTTG CGATTAAGCA AAGAGCTGTA CGAAGCCTAT 
CCTAACAATG TCTTTTTTAA AAACGGACTT GCTATTTCGT ATGAAAAACT CGGAAATACG 
CACACCTCGC TTGGTAATCT CGACAAAGCG CTGACTTATT ATGAGCAATA CTACAAGTTA 
AGTAAAGAGC TGTATGAAGC CTATCCAAAC AACGTCTCTT TCAAGTTTGG CTTAGCTGTT 
TCTTACTCTA AATTCGGAAA CACGCACACC TCGCTTGGCA ATCTCGACAA AGCACTGAGC 
TATTATGACA ATGAAACTCG TTTATTTGAA GAGTTGTATG AAGCCTATCC AAACAACGTC 
TCCTTCAAAA ACGGACTTGC TATTTCGTAT TCTGCATTAG GACAATTCTA TCGTGATCAT 
CGTAATGATT CAGATATAGT GAAGAACTAT TTCCAACAAG CGGAAAAAGT ATGGGCTGAG 
TTAGTTTCAA GTTCTCCACA ACATGCTGAG TTCAAACAGA ACTTATCATG GGTAAAAAAT 
CAATTACAAA GTCTTCATTC ATAA

Protein sequence

MSNELLDEKL RLLVKALRAD TFHFVLIINN HPSVYNDVVE WLKQHITDRE IRELRLTGKH 
YREVSDVLQA AKQDIVTIPD FDELFTKEND DVRVALNQRR DFLAFQRMNL VCFLSPDTFR 
LLPKKIPDLW SLRSLELDIA YDIKEPLFTI PTTPFISSLG GTTIAEKEAE IRRLTYQLSQ 
IDPANIALRK ELEAQLVTLQ MEVPQRFEEA TSLHDTSQKN IIAAEVTATQ DETVTNISTS 
ILRSIFAVLP SEPITLIALQ ELLPNIDNLE TALQNLVAEN VLNYNSTTKS YKCSPVVQEV 
TRKQQSDHLF ADIEQLISRL IDRLAYEPNT GHVTEVSYET AALYVRYGET ILRNCTDVEY 
QLAALADRIG NYHTATGNLD KALSFHAECL RLSKELYEAY PNNVFFKNGL AISYEKLGNT 
HTSLGNLDKA LTYYEQYYKL SKELYEAYPN NVSFKFGLAV SYSKFGNTHT SLGNLDKALS 
YYDNETRLFE ELYEAYPNNV SFKNGLAISY SALGQFYRDH RNDSDIVKNY FQQAEKVWAE 
LVSSSPQHAE FKQNLSWVKN QLQSLHS