Gene Cag_1768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1768
Symbol
ID	3746628
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2285395
End bp	2286873
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	50%
IMG OID	637774305
Product	TPR repeat-containing protein
Protein accession	YP_380062
Protein GI	78189724
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGATGT TGGCGGGATG CTCTTCCAGC TCGTCAACAG TTTCCACCCA AAAAATCCAA 
GCACCTCTTC CCAAACCACT GCCCGAAACC GTTGCGTATG AGCTGGCTAC GGCATCGCTT 
TTAATGGCGC AAGGTGAGTA TCAGCAAGCG CTTGAGCGAT ATCGAGCATT GCTTACCACA 
GAGTCCAACA ATGCAGCCCT GCACCACGCC TTAGCAAAAG CCTACACCGC AAATGGAGAG 
TTTGTGGCAG CACGCCAACA TAGCCAACAA AGCGTTACGT TAGAAGGCAC CAATGTGTGG 
TATTTGCGAT TGCTTATTGC ACTAACGCAC AATGAAAGCG ATTATGCGCA AGCGGTTGCA 
TTAAGCAAAA AGTTGGTGAC TTTGGAACCC GATAACCGCG AAGCGCTTAC CATGTTAGCC 
TATGAGCACT TAGCGGCACG TCAGCCCAAC GAAGCGCTGG AGGTATTTCA ACGCTTATTG 
CAGCTTGATC CCGCAAATGC TGAAGTATTG CTGAGTAGCG CCGAAGTAGC GCTTGAACTT 
GGTCGCCGTA GCGATGCCCT CCGCTTCTTT AATCAACTCC TTCACTATGG TATTGAAAGT 
GATTCCATCC ACTTTTTTAT AGGCGATTTA CAACAGCAGC AAGGGTTACA CGAAGCCGCA 
CTTGCAAGCT ACCGCAACGC CCTCAAGCTC AATCCGCACC TTTTGCCCGC ATGGTATCGC 
CGCCTTGAAC TTGTAGCACT TTCTCCCAAC CTTTCCCAAT CCTCAAAACC AACACTTTTT 
GCCGAAGAGC TTCAGCATTT CTATAAGCAA AGCGGCACAA CATTGGAGCA ACAATTGGGG 
CTTCTCCAGC TCTTTACAAA TCGAGCAACT CGCAACCCAG CCTTCATAAG CGCAACCCAA 
AGCATGATAA AAGCGCTACA ACAGCGCTAT TCATCTCACT CGCTTGTACG TTTTACCGTG 
CAAATTGCGC AAGGGCGATT GTTTGTGGCG CAAGGCCAGC ACGCCCAAGC CATTACACTG 
CTACGCCAAG CTCTCCGCTC ACCCCATGCT ACACGCCAAC CTAATGTAGC GCTTGATGCC 
GAGAGTACCC TTGCCCTTGC TTACGAGCGT TCTGGTAAAG TGACGGAGAG CATTCGTCTC 
TACGAAAAGA TGTTACGCCG CACGCCCAAC AACGCCCTGC TTGCCAACAA TCTTGCCTAC 
TTGCTTGCCA CACAACATCG AGAGTTGCCA CGCGCTCTTG AGCTTGCCAA AAAAGCTGTT 
GCGGCGGAAC CAAATAATCC CATTTATCTT GATACGCTTG GTTGGGTACA TTTTGCCATG 
CAGCAATACG AACCTGCCCG TGAGCTACTT GAAAAAGCGC TGCAAGGTGA GCCGAATGAG 
CCAGAAGTGA TTGAGCACCT TATTGCGGTA TATGAAAAGC TTGGGAACCA AAGCAAAGTG 
CAGGAGTTGC AGGAGCGGTT GCGGAGGGTT TGTTTATAA

Protein sequence

MLMLAGCSSS SSTVSTQKIQ APLPKPLPET VAYELATASL LMAQGEYQQA LERYRALLTT 
ESNNAALHHA LAKAYTANGE FVAARQHSQQ SVTLEGTNVW YLRLLIALTH NESDYAQAVA 
LSKKLVTLEP DNREALTMLA YEHLAARQPN EALEVFQRLL QLDPANAEVL LSSAEVALEL 
GRRSDALRFF NQLLHYGIES DSIHFFIGDL QQQQGLHEAA LASYRNALKL NPHLLPAWYR 
RLELVALSPN LSQSSKPTLF AEELQHFYKQ SGTTLEQQLG LLQLFTNRAT RNPAFISATQ 
SMIKALQQRY SSHSLVRFTV QIAQGRLFVA QGQHAQAITL LRQALRSPHA TRQPNVALDA 
ESTLALAYER SGKVTESIRL YEKMLRRTPN NALLANNLAY LLATQHRELP RALELAKKAV 
AAEPNNPIYL DTLGWVHFAM QQYEPARELL EKALQGEPNE PEVIEHLIAV YEKLGNQSKV 
QELQERLRRV CL