Gene Cpha266_2189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2189
Symbol
ID	4571001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2525166
End bp	2526227
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	50%
IMG OID	639766762
Product	hypothetical protein
Protein accession	YP_912616
Protein GI	119357972
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATGA GAAAAAAAAC AGGTAAGGAG GTCTCTATTG TTCGCTCCTC GGCGGCTGAA 
TACCTGACCT TTATCGCTGC CAGCGGCACA GGGGGCGTCG ATGCGGTTTA TGCCGATGAA 
AATATCTGGC TTACCCAGAA GATGATGGGG GTGCTCTATG ACGTGGCGAC TCATACCATA 
AACTATCACC TGAAAAAAGT TTTTTCAGAC AGCGAATTAC AGGAGGACTC AGTTATTCGA 
AATTTTCGAA TAACTGCCCG AGACGGAAAA AACTACAACA CCAAACATTA CAGTCTTGCT 
GCTGTCATTG CCGTCGGTTA CAAGGTAAAT TCCGAACGTG CAGTACAATT CCGCAAGTGG 
GCGACCACTA TCATTAAGGA GTTCACCATC AAGGGCTATG CCATGGATGA CGAACGACTG 
AAAAGCGGTG GCTCCATCCT TACCGACCAG TATTTTGAAG AGCAGTTGCA GCGTATTCGG 
GAGATTCGCT TGAGTGAACG CAAGTTCTAC CAGAAGGTCA CCGACATCTA TGCAACCTCC 
ATCGATTACG ACGTGACAGC CCAGGCTACC AAGCGCTTTT TCGCTACCGT GCAGAATAAA 
CTGCACTGGG CAATACATGC AGAGACCGCA GCGGAGGTTA TCTATAACCG GGCCGATGCC 
GAAAAACAGA ATATGGGGTT GACCACCTGG AAGGATGCTC CCGGAGGAAA GATCCAGAAG 
TTCGACGTTG TGGTCGCAAA GAACTACCTG ACCGAACATG AAATAGCACA ACTTTCACGG 
TTGGTTTCGG CATACCTGGA TGTTGCAGAG GACATGGCGC TACGCAAGAT GCCCATGACC 
ATGCAGGACT GGGAAACCCG CCTCAATCGC TTCATCGCAG CGACTGATCG TGAAATTCTT 
CAGGATCCGG GCAAAGTGAC TGCAGAAATT GCCAAAGCTC ATGCCGAAAG TGAGTTTGAA 
AAGTACCGCA TCGTTCAGGA CAGGCTATTC GAAAGCGACT TCGACAGAAT GGTCAAGGAG 
ATCGAGTCTC TGCAGAAGCC GAAGGGAGGG GGTGATGAGT AG

Protein sequence

MSMRKKTGKE VSIVRSSAAE YLTFIAASGT GGVDAVYADE NIWLTQKMMG VLYDVATHTI 
NYHLKKVFSD SELQEDSVIR NFRITARDGK NYNTKHYSLA AVIAVGYKVN SERAVQFRKW 
ATTIIKEFTI KGYAMDDERL KSGGSILTDQ YFEEQLQRIR EIRLSERKFY QKVTDIYATS 
IDYDVTAQAT KRFFATVQNK LHWAIHAETA AEVIYNRADA EKQNMGLTTW KDAPGGKIQK 
FDVVVAKNYL TEHEIAQLSR LVSAYLDVAE DMALRKMPMT MQDWETRLNR FIAATDREIL 
QDPGKVTAEI AKAHAESEFE KYRIVQDRLF ESDFDRMVKE IESLQKPKGG GDE