Gene Cag_1988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1988
Symbol
ID	3747367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2523442
End bp	2524794
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	48%
IMG OID	637774525
Product	hypothetical protein
Protein accession	YP_380279
Protein GI	78189941
COG category	[S] Function unknown
COG ID	[COG4198] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCAGT GGCATTGCAA GGCTTTTCTT ATTTTGCGCC ACTCTTTTAA CGAACAGTGC 
AACCTTTTTA TGCCCGAAAT AAAACCCTTT TCAGGGGTGC TCTACCATCC TGAATTATTG 
AAGCAAGCAG ACAAACTAAT CTGCCCTCCT TACGATATTA TCTCCTCAGC CCAGCAGCAA 
TCGCTGTACC ATCGTTCCCC ACTGAATGCT ATTCGCCTTG AATTGCCACT TGAGGAGAAT 
CCTTACGGAA CTGCCGCTGC ACGTTTAACG CAATGGCTTC AGTCGGGCGA ACTTCAGCGC 
GATAGTGAGC CGGCGATCTA TCCTTACTTT CAAACTTTTG AGGATTTAGA GGGCAAGAGC 
CATGTGCGCC ATGGATTTTT TACCGCAATG CGTTTGCATG AGTTTTCGGA AAATAAGGTG 
CTACGCCACG AAAAAACCCT ATCGGCACCA AAAGCTGATC GCTTGAACCT TTTTCGGGCA 
ACGCGCACCA ACATTAGTCC TATTTATGGC TTGTATGCCG ATGAGCATCG CACGCTTGAC 
CAACTTATGG TGGCGTACAG CGAAACGCAC GAGCCACTGC TTGATGCCAA TGTGCAAGGC 
ATACGCAATC GCTTGTGGCG CATTACTGAG CCTACGCTTT TAGAGCAATT CCGCCAAACC 
TTGCTTAATC GCCAAGTTTA CATTGCCGAT GGGCACCATC GTTACGATAC GGGCGTTACC 
TACCGCAACG AGCGTATGGC AGCAAATCCT ACCCATAATG GCAATGAGCC GTATAACTTT 
ATTTTTAGCT GCCTTACCAA TATTTACGAT GAAGGCTTAA TTGTTTTTCC GCTGCATCGC 
GTGCTGCATA GTGTGGCTGA TTTTAATGCC GAGCGTCTTA AAGAGCAGCT TGCGGAATTT 
TTTACCATTA CTGACCTCAA TAGCCAAGAT GAATTGAAAG CCTATCTTGC GGCATCTACC 
TCATCATTTA GTTATGGCGT GGTAACGAGT GGTGCGCTGT ATGGTATGAC GCTTAAAGGT 
GAAGCGGCAC CGTTGCTTGA TGCCCAGTGT GCCCATTGCC CCGAAGCGGT AGCGCAACTT 
GGTGTGGTGG TGTTGCATCA GGTGATTTTT CATAAGCTGC TTGGCATTTC GCATGAAGCT 
ATGGAAGCTC AGCGCAATTT GCTTTATGTT ACCGATGTGA ATGAGGTGTT TCATGCCGTT 
GCCTGCCGCA CCGCTCAAGC GGGCTTTGTG GTAAAGCCCA CCACGGTGCA GCAAGTGCTT 
GACGTGTCGG AATCGGGCGA GGTGATGCCG CAAAAGTCCA CCTTCTTCTA TCCAAAGCTT 
ATGACGGGCT TGCTCTTTAA CCCGCTTGAT TAA

Protein sequence

MMQWHCKAFL ILRHSFNEQC NLFMPEIKPF SGVLYHPELL KQADKLICPP YDIISSAQQQ 
SLYHRSPLNA IRLELPLEEN PYGTAAARLT QWLQSGELQR DSEPAIYPYF QTFEDLEGKS 
HVRHGFFTAM RLHEFSENKV LRHEKTLSAP KADRLNLFRA TRTNISPIYG LYADEHRTLD 
QLMVAYSETH EPLLDANVQG IRNRLWRITE PTLLEQFRQT LLNRQVYIAD GHHRYDTGVT 
YRNERMAANP THNGNEPYNF IFSCLTNIYD EGLIVFPLHR VLHSVADFNA ERLKEQLAEF 
FTITDLNSQD ELKAYLAAST SSFSYGVVTS GALYGMTLKG EAAPLLDAQC AHCPEAVAQL 
GVVVLHQVIF HKLLGISHEA MEAQRNLLYV TDVNEVFHAV ACRTAQAGFV VKPTTVQQVL 
DVSESGEVMP QKSTFFYPKL MTGLLFNPLD