Gene Cag_1824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1824
Symbol
ID	3746455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2345498
End bp	2346481
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	40%
IMG OID	637774362
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_380118
Protein GI	78189780
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATACC AAATGCAGAT GCCTGCAAAA ATAGAGCTTG ACGAATCTTC TCATAGTGAT 
AGTTTCGGGA AGTTTATCGC CCAACCGCTT GAGCGTGGTT ATGGCGTTAC TCTTGGCAAC 
TTGATGAGAA GAGTGTTGCT TGCCTCGTTA CCGGGAACTG CAATTACAGG TATCAAAATA 
GAGAATGTTT ATCATGAGTT CTCTACTATT CAGGGCGTTC GCGAAGATGT TCCTGAAATT 
GTGTTAAATC TTAAAAAGGT TCGCTTTCGA TCACAATGTA AGCGTAGTTG CAAAACCACG 
GTAACATTGG TTGGTCCTAT GGAATTTACC GCAGGTGTTA TTCAGCCGCA AGAAGGTGAG 
TTCGAGGTTC TTAATAAGGA TTTACATATT GCGACTATCA ATGCGGGTAC AACCGTTACG 
CTTGATATTT TTATAGGACG TGGTCGTGGT TATGTGCCTG CTGAAGAAAA TCGTGCTGAA 
GGAATGCCGC TTGGGTTTAT TCCAATTGAC TCGATTTTTA CCCCTATTCG TAATGTAAAG 
TTTACGGTTG AAAATACTCG TGTGGGGCAG CGTACTGATT ATGAAAAAAT GATTCTTGAG 
GTTGAGACTG ATGGTTCAAT TACTCCTGAT GATTCCATTA GTTTAGCAGG AAGAGTTATT 
TCTGATCATG TTTTACTTTT TGCTGATTTC TCTCCTGCTG AAGAGGAATA CACAGAAGAA 
GAGTTCAAGC AGCAAGATGA TGAGTTTGAA ACGATGCGTC GTTTGTTAGC AACAAAAATC 
GAAGATCTTG ATTTATCGGT TCGCTCACAC AATTGCTTGC GTCTTGCTGA AATTGATACG 
CTTGGAGAGT TAGTTTCGCA TAAGGAAGAT GAGTTGTTGA ATTACAAAAA CTTTGGTAAG 
AAGTCGCTTA CCGAGCTTAA AGAGCAACTT GATAAGTTTG ATCTTAAGTT TGGTATGGAT 
ATTACCCGTT ACCAAATGAA GTAA

Protein sequence

MIYQMQMPAK IELDESSHSD SFGKFIAQPL ERGYGVTLGN LMRRVLLASL PGTAITGIKI 
ENVYHEFSTI QGVREDVPEI VLNLKKVRFR SQCKRSCKTT VTLVGPMEFT AGVIQPQEGE 
FEVLNKDLHI ATINAGTTVT LDIFIGRGRG YVPAEENRAE GMPLGFIPID SIFTPIRNVK 
FTVENTRVGQ RTDYEKMILE VETDGSITPD DSISLAGRVI SDHVLLFADF SPAEEEYTEE 
EFKQQDDEFE TMRRLLATKI EDLDLSVRSH NCLRLAEIDT LGELVSHKED ELLNYKNFGK 
KSLTELKEQL DKFDLKFGMD ITRYQMK