Gene Cpha266_2733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2733
Symbol
ID	4569977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	3124050
End bp	3125063
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	53%
IMG OID	639767301
Product	aminodeoxychorismate lyase
Protein accession	YP_913141
Protein GI	119358497
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.269056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTATCCG ATAAATCATC TGCACAGAAA ACGCTATTTG CAGGGCTGTT CCTGCTCTTA 
CTGTCGCTTT GCGGAATATT TTTCATTCCG GGCCTGAATA CCGCCGGGAT GCCGACCCGG 
CTTGTCGTCC ACAGGGGTTC GGGGTTTATG GCTATTGCCG ACACCCTTCG CAGGAACGAA 
GCCATTAAAA ACCGCTGGCA GGTTGTGCTT ACCGGCAGAA TGATTCCCGG ATTGCACAAG 
ATCAAACCCG GCAGGTATTC CATTCCCCCC GGGTTGTCGA ACTTCGGGCT GTTGCGATAC 
CTGCATACAC ACCATCAGGA TGAAGTCCGC ATCACCATTC CGGAAGGTCT GGAGCAACGG 
GAAATTGCCA GGAGGATGGC GGGAAAACTC GATATGGACT CTTCCCGCTT CATGAAGGCG 
GCAAAAAACG CCGCGCTGCT GTCGAAATAC CGGATATCCG CCCAAAGCGC TGAAGGCTAT 
CTGTTCCCCG GTACGTATGA TTTCGCATGG GGCAGTACGC CCGATGAGGT CGCAGGGTTC 
CTTATCAGCC GGTTCAGACT GTTTTATTCC GACTCTCTTC AACGCGCGGC GGCGTCAAAA 
GGTCTGACTG AGACAAGCCT GCTGACCCTC GCTTCGATCG TTGAGGCAGA AACCCCTCTC 
GACGAGGAAA AACCTCTTGT TGCCGGCGTC TATCTCAACC GGTTAAAAAA AGGCATGCGC 
CTGCAGGCCG ATCCGACCGT TCAATACGCT CTTGACGGAC CTCCGCGCCA TCTTTATTAC 
AAGGATCTTG CCATTGATTC TCCCTATAAT ACCTATCGCT ACGGCGGTCT GCCGCCAGGA 
CCGATCTGTA ATCCCGGAAC GGCATCGATA CTTGCCGTTC TCAATCCCGA AGAAACCGGG 
TTCATCTACT TTGTCGCAAC AGGAAAAGGT GGTCACTATT TTGCTGAAAC CATCGCTGCG 
CATCACGAAA ACATCAGAAA ATACAAGGCG GCCAAGCATG CGTCATTACC CTGA

Protein sequence

MLSDKSSAQK TLFAGLFLLL LSLCGIFFIP GLNTAGMPTR LVVHRGSGFM AIADTLRRNE 
AIKNRWQVVL TGRMIPGLHK IKPGRYSIPP GLSNFGLLRY LHTHHQDEVR ITIPEGLEQR 
EIARRMAGKL DMDSSRFMKA AKNAALLSKY RISAQSAEGY LFPGTYDFAW GSTPDEVAGF 
LISRFRLFYS DSLQRAAASK GLTETSLLTL ASIVEAETPL DEEKPLVAGV YLNRLKKGMR 
LQADPTVQYA LDGPPRHLYY KDLAIDSPYN TYRYGGLPPG PICNPGTASI LAVLNPEETG 
FIYFVATGKG GHYFAETIAA HHENIRKYKA AKHASLP