Gene Cpha266_2140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2140
Symbol
ID	4568635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2477556
End bp	2478968
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	53%
IMG OID	639766715
Product	hypothetical protein
Protein accession	YP_912569
Protein GI	119357925
COG category	[S] Function unknown
COG ID	[COG4320] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG CCAAATCCTC TTCCGTCCGA TCAACCCTTC CCGAGCAGTC TCATGGACGC 
CCCCTGAGTG AGCGCTTTGC AGAGGGCGCC GCCTTGCGCA AACAGTGCCC TCGCTCACGG 
CAAGGAACGT GGCAGCCCGT AAAAGAGCGG GTTAATCCGA TTGATCTGCT TATTGAAAAC 
AATACGGGAC GGGTTGAAAG CCTTGTGCCG ATCCGTTTCG GGCGAATGCT TGCCAACCCT 
TTTGCTTTTT ATCGTGGATC TGCCGCAGTG ATGGCCAGCG ATTTATTTTC TACGCCATCA 
AGCGGTCTTC GTGTTGTTGC CTGCGGAGAT TGCCATCTCA TGAATTTCGG TGGTTTTGCC 
AGTATGGAGC GCCGTCTTGT TTTTGATATC AATGATTTTG ACGAGGTTTC CGTCGCGCCC 
TGGGAGTGGG ACGTCAAACG GCTTGCTGCA AGCTTTATGG TTGCCTCACG CCAGAACGGT 
TTCAGCGAAA AAGAGGGCAG GGATGCAGCC TGGTGGGCAG CAAGAAGCTA TCGAACCAGA 
ATGTTCCGGT ATGCCGATAC TTCGATTCTT GACGCCTTCT ATGAATTTAT CGACCTGAAA 
AAACTCGTCG ATGCAGGAAC CGATGAAGAG ATGCGACGTC TTGGCAGAAA GCGTATCAGA 
AAAGCTACCG AAACCGCTAC CCATCAGAGT GACTTTCTCA AGCTCGCCAC CCTTGCCGGA 
AAAACACCCC GGATCAAGGA CGATCCGCCC CTTGTCTATC ACGATCAGGA CATGCAGAGC 
GACGATGCAT TCAGCGAAGT TGCGCACAAG GTGGTGCAGA GTTACCGCAG CAATCTCCCG 
CCTGAACGCA GGTTATTGCT CGATCGCTTC AGGTTGACAG ACGTAGCGGT TAAGGTAGTT 
GGCGTCGGCA GTGTCGGCAC TTATTGCGGG ATTGCACTAT TTATATCCGG AAATGGCGAT 
CCGCTCTTTC TGCAATTCAA GGAGGCGCGA AATTCTGTGC TCGAACCCTA TGCAGGCAGC 
TCGCCGTTCA AAACCCATGG CGAGCGGGTT GTATTTGGTC AACGGCTGAT GCAGGCCTCC 
AGTGACGTTT TTCTCGGCTG GGCCAAAGGG GTATCGGGCA GGCATTTCTA TGTGCGGCAA 
CTTCGAGATG CCAAAGTCAA ACCGCTTGTC GAGGTGATGA AACCGCTGAA CATGGTCAAC 
TACGCAAAAG CCTGCGGCTG GGCACTGGCC CGAGCCCACA AACGATCCGG CGATGCTGTT 
GTGCTGAGCG GTTACATGGG AAAAAGCGAT GCCTTCGAAA ATGCCATAGC AGCCTTTTCC 
GTAGCCTATG CCGACCAGAA TGAGCGGGAT TACGAGGAGC TCATCAAAGC CGTACGTAGC 
GGCAGAATCG AAGCCCGAAT CGAAACGGCC TGA

Protein sequence

MKKAKSSSVR STLPEQSHGR PLSERFAEGA ALRKQCPRSR QGTWQPVKER VNPIDLLIEN 
NTGRVESLVP IRFGRMLANP FAFYRGSAAV MASDLFSTPS SGLRVVACGD CHLMNFGGFA 
SMERRLVFDI NDFDEVSVAP WEWDVKRLAA SFMVASRQNG FSEKEGRDAA WWAARSYRTR 
MFRYADTSIL DAFYEFIDLK KLVDAGTDEE MRRLGRKRIR KATETATHQS DFLKLATLAG 
KTPRIKDDPP LVYHDQDMQS DDAFSEVAHK VVQSYRSNLP PERRLLLDRF RLTDVAVKVV 
GVGSVGTYCG IALFISGNGD PLFLQFKEAR NSVLEPYAGS SPFKTHGERV VFGQRLMQAS 
SDVFLGWAKG VSGRHFYVRQ LRDAKVKPLV EVMKPLNMVN YAKACGWALA RAHKRSGDAV 
VLSGYMGKSD AFENAIAAFS VAYADQNERD YEELIKAVRS GRIEARIETA