Gene Cag_1101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1101
Symbol
ID	3747968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1488373
End bp	1489581
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	33%
IMG OID	637773632
Product	putative transcriptional regulator
Protein accession	YP_379406
Protein GI	78189068
COG category	[K] Transcription
COG ID	[COG2865] Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000119822
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTCCC GCCTTCGCGG GAATGACAGA AATATTAAAC ATACAACTAT GAACGAAGAA 
TTCATTAAAG AACTGATAAG TAAAGGTGAG ACAAGTAGTA CGCAGTTCAA GTTAAATATT 
AGCAATGAGC TAAGTATTGC CCAAGAAATG GTAGCATTTG CTAACACGAA AGGTGGGAGG 
ATTTTAATTG GTGTTGACGA TAAAACATGG GAGGTTATTG GTCTTACTGA TAATGATATA 
AGAAGATTAA CTAATTTGCT GGTTAACGCT TCAAGTGAAC ATATAAAACC GCCTCTCTTT 
ATTGAAACTG AAACGTTTAT TATAGATGAT AAGAAAATAA TTGTTGTTGT AGTGCCTGAA 
GGTAGCGATA AACCTTACAA AGATAAAGAT GGCATTATTT TTTTAAAGAA TGGTGCTAAT 
AAACGAAAAG TTACTAATAA CGAAGAAATA TTACGACTAT TAAGTAAAGG AAAGCATTTA 
TTTGCTGATG AATTACCAGT CAATCAAGCT ACTATTGAGG ACATAAACAA AGATAAATTT 
GATAAATTCT TTTTGCGTGA ATTTAATGCT GAATATGAAG CATTAGGATT AAGCTATCAA 
GAAGCTTTAA AAGCAAAGAG AGTTTTAAAA GAAGGAAAAA TAACGTTAGC TGGCTTTTTG 
TTTTTTGGTA AAATGCCACA AAATATTAAA CCTGCATTTT GCATCAAATG CGTTGCCTTT 
TATGGTAATA GTCTTGGAGG TACCGAATAT AGAGATAGTC GAGACATTAA CGGAACAATA 
CCAATCTTAT TCGATGAAGG GATGGCTTTT TTCAAACGTA ATTTATTGCA TACTCAGCAA 
GGGCAAAATT TTAATTCACA AGGCATTCTT GAGATTTCTA TAATTGCATT GCAAGAGCTT 
TTGGAAAATG CGCTTATCCA CAGAGATTAT ATTAAAAATT CTCCTATACG ATTGTTGGTT 
TTTGATAACA GAATTGAAAT AATAAGTCCA GGATGTTTGC CTAATAGCTT GGTAGTAGAG 
GAACTTCGTT ACGGTAATCC TGTCGTAAGA AATAACTTAA TGGTAAGCTA TGCCCTTCAC 
ACTATGCCAT ATAGAGGATT AGGTTCCGGA TTAAAAAGAG CTTTTGAGCA GCAACCTAAT 
ATTGAGCTTA TTAACGATAC TGAAGGCGAA CAATTTAAAG TTATTATTCC ACGACCAGAA 
AAGAGATAA

Protein sequence

MDSRLRGNDR NIKHTTMNEE FIKELISKGE TSSTQFKLNI SNELSIAQEM VAFANTKGGR 
ILIGVDDKTW EVIGLTDNDI RRLTNLLVNA SSEHIKPPLF IETETFIIDD KKIIVVVVPE 
GSDKPYKDKD GIIFLKNGAN KRKVTNNEEI LRLLSKGKHL FADELPVNQA TIEDINKDKF 
DKFFLREFNA EYEALGLSYQ EALKAKRVLK EGKITLAGFL FFGKMPQNIK PAFCIKCVAF 
YGNSLGGTEY RDSRDINGTI PILFDEGMAF FKRNLLHTQQ GQNFNSQGIL EISIIALQEL 
LENALIHRDY IKNSPIRLLV FDNRIEIISP GCLPNSLVVE ELRYGNPVVR NNLMVSYALH 
TMPYRGLGSG LKRAFEQQPN IELINDTEGE QFKVIIPRPE KR