Gene Cpha266_1972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1972
Symbol
ID	4570412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	2286508
End bp	2287701
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	52%
IMG OID	639766553
Product	GntR family transcriptional regulator
Protein accession	YP_912409
Protein GI	119357765
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACGTT TCTCAAAAGC CGTATCGCTG CTCCGGTCAT CTGAAATCAG GGATCTCATG 
ACCCTTGCCT CAAGGCCTGA CATTATCTCC TTTGCCGGAG GCATGCCTGG CAATGATCTC 
TTTCCCGTGC AGGAAATAGA AGAGCTCTTC AGCAACCTCG ACGAGAAAAC AAAACAGGCA 
GCATTTCAGT ATGGGCCTAC ACCGGGTCTT CCCTCTCTGC TTGAATCTCT TTCAGGATTT 
CTTGAGCGCA AAGGACTGCC GGTCAAAAGC AACCGGCTGC TCATCACCAC CGGTTCCCAG 
CAGGCACTCA GTCTGCTTGC CAAAACCTTT ATAGATCCGG GGGACCGGGT GCTGGTTGAA 
CAGCCCTGTT TTATTGGAGC TCTTTCAGCA TTCCGTTCCT CTGAAGCCGC GCTGCATGGC 
ATCCCTGTTG ACAGGGAGGG ACTGGTCATC GATCTGCTCA ACGAAGAAAT CAGAAAAAAA 
GAGAGAGCCA GGCTGCTCTA TATCACCCCC TATTTCCATA ATCCGGCAGG CCTGCTCTAC 
AGCAAGGAAC GTAAAGCAGA ACTTATCAGA ACACTGCAAG GTTCAAACAT CCCGCTCATC 
GAGGATGATG CCTACGGCGA CCTGTATTTC CATGAAGAGG ATCGGGAACG GTTACAACCA 
ATCAAATCCA TCGATCCGGA AGACATTGAT GTCTGTTATA CCGGTTCCTT CTCGAAAATT 
CTCGGTCCCG GCCTCAGGCT CGGATGGATG CTCGTCCCTG AAGCGATCCA TGAAAAATGC 
GAGCTGATCA AACAGTCGGC CGACGCCTGT TCTCCAAGTT TCACCCAGGT GCTCGCTGAC 
GCCTTCATCC GTTCCGGCAA GATCGACAGC TATATTGCCG GTGTACGTCA GGAATATAAA 
AAAAGAGCTT CGGCCATGGT TGCCGCTCTG AAGGAGCATC TCCCATCATA CGTTCACTAC 
AACGAACCAA GGGGCGGATT CTACATCTGG CTGACGCTGC CGGAAGGGAG CGACGCAACG 
GAGATCATGA AAATCGCCGT CAAAGGCGGG GCGGTCTTCG TTGCAGGAAA AACCTTTGAT 
CCTGAAGGAA AAAAAAACAA CACGCTTCGC CTCTCCTACT GCAACAACAC CCCGGAGCAG 
ATCGCCGAAG GAATTCCGAT CATCGCGGCT GCAATCAGGC TGCTCTGCGG TTGA

Protein sequence

MQRFSKAVSL LRSSEIRDLM TLASRPDIIS FAGGMPGNDL FPVQEIEELF SNLDEKTKQA 
AFQYGPTPGL PSLLESLSGF LERKGLPVKS NRLLITTGSQ QALSLLAKTF IDPGDRVLVE 
QPCFIGALSA FRSSEAALHG IPVDREGLVI DLLNEEIRKK ERARLLYITP YFHNPAGLLY 
SKERKAELIR TLQGSNIPLI EDDAYGDLYF HEEDRERLQP IKSIDPEDID VCYTGSFSKI 
LGPGLRLGWM LVPEAIHEKC ELIKQSADAC SPSFTQVLAD AFIRSGKIDS YIAGVRQEYK 
KRASAMVAAL KEHLPSYVHY NEPRGGFYIW LTLPEGSDAT EIMKIAVKGG AVFVAGKTFD 
PEGKKNNTLR LSYCNNTPEQ IAEGIPIIAA AIRLLCG