Gene Cag_0021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0021
Symbol
ID	3747891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	21262
End bp	22461
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	48%
IMG OID	637772545
Product	hypothetical protein
Protein accession	YP_378343
Protein GI	78188005
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0629415
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTCTG AAGAATTGCA ACAGCTTCTC ACGCCTGAAG CGCAAGCAAT GCTGCAAGCG 
CACCAGCACG ACAATCCTAC AACGTTTGCC TTGCGTTATT CCAATCGCCA CGACTTGCCA 
ATTCGTGCGC TTGCGGAGCA ACTTGCCTGC CGTCGCAAAG CTGAACGTAA GCTTCCCACG 
CTTTCGCGCC ACAACCTTCT CTACACAACG CTCTCGCTTG AGCAAGCTTC AAGCGAACGC 
ACGGCACGTT TTAAATGCAC CTTCATGCAA GGAAAGCGCT GCATTGATTT GAGCGGTGGT 
TTGGGGATTG ATGCCATCTT TTTAGCCGCT CATTTTGAGG AGCTACTTTA TTGCGAACGC 
AATGAACTGT TGTGCAACGT GGTTCGGCAC AATATGGTGC GTTGCGGGAT TGGCAACGTT 
CGATTGCAGC AAGGCGATAG TCTCAGCTTT TTAGCAAGTC AGCCCGATAA TGCCTTTGAT 
TGGATTATGG TTGATCCCGC TCGTCGTGAG GAGGGGAAAC GCTCCATTGG GTTGGAGGCA 
GCAAGTCCCA ATGTGGTGGC ATCTCAGGAA TTGTTGCTTG CCAAAGCGCC ACACATTTGC 
ATTAAAGCCT CGCCAGCCCT TGAAATCAGC AATCTTAAAA TGCTCTTACC TGCGCTCCAT 
ACCATTTTGG TAGTTTCGGT TTCGGGTGAA TGCAAAGAAA TTTTATTGCT CTTAAAGCGA 
GGGGCTGAAG CTGAACATCC AATTACGAAA GCAATCTGTT TGCAAGCCGA CAATAATGCG 
GTTGTAGAGA TTGTTGGAAC GCATGAACAG CATCGTTCAC TTGCTGAATC TCTGCAATGT 
TACTTGTATG AACCTGATGC GGCAATTATT AAAGCGCGAC TTAGCGGAGT GGTCGCTAAG 
CAAGAGGGGT TAGAATTTCT TAATAAGAGC GTTGATTATT TAACAAGCAA TCATGTTGTT 
GCAAGTTTTG CAGGTAAAGT ATTTCAAGTG ATTGAAAGCG TGCCCTACAA GCCAAAAGAG 
TTTCGGAAGT TTTTGGATCG CCACGCTATC AGCGCCGCCA GCATTCAGCG GCGTGATTTT 
CCCCTTTCAG CCGATGAGTT ACGCAAGAAG TTCCGCTTGC GCGAAGATGA AAAGCATTTT 
CTCATTTTTA CCCGCAACCG CAACGCTGAG CCTATTTGCA TTTACGCTGA GCGCTGTTGA

Protein sequence

MTSEELQQLL TPEAQAMLQA HQHDNPTTFA LRYSNRHDLP IRALAEQLAC RRKAERKLPT 
LSRHNLLYTT LSLEQASSER TARFKCTFMQ GKRCIDLSGG LGIDAIFLAA HFEELLYCER 
NELLCNVVRH NMVRCGIGNV RLQQGDSLSF LASQPDNAFD WIMVDPARRE EGKRSIGLEA 
ASPNVVASQE LLLAKAPHIC IKASPALEIS NLKMLLPALH TILVVSVSGE CKEILLLLKR 
GAEAEHPITK AICLQADNNA VVEIVGTHEQ HRSLAESLQC YLYEPDAAII KARLSGVVAK 
QEGLEFLNKS VDYLTSNHVV ASFAGKVFQV IESVPYKPKE FRKFLDRHAI SAASIQRRDF 
PLSADELRKK FRLREDEKHF LIFTRNRNAE PICIYAERC