Gene Cpha266_0056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0056
Symbol
ID	4571248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	60768
End bp	62186
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	52%
IMG OID	639764658
Product	peptidase M12A, astacin
Protein accession	YP_910550
Protein GI	119355906
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCGTA AAAAAAACGG AAACACTCCA CAGGAGTATG GCGAATTCTC TCCATCAGGT 
AAGCTGCGTA CCGCTATTAT CGAGGGGAAT ACGTTTGGGT ACAAGTCGGT TCAGTATACT 
GACGTTGATG GAATGGCCAT GTTTGAAGGG GACATCATTC TCGGCAAGGT TGCCGATGTC 
GACAGCAAAA CCGAGCAGCG CAAACGGGAG ATACAGCAGG GGGTTACGCT GCGGGGCATT 
ACCATTACAG GAGCCAAGTA CCGATGGCCG AACTGTAAAG TCCCCTACAC CATCGATACG 
GCTCTGCCTA ATCAGAGCAG AGTAACCGAT GCCATAGCCC ACTGGGAGGC AAAAACAAAG 
TTCCGGTTTA TTCTTCGAAC AAATGCCAAT GCGTCAAGTT ATCCTGACTG GGTAACATTC 
AGATCGGGTT CCGGCTGCAG CTCCTATGTC GGGAAACAGG GCGGCCAGCA ATACATTAAT 
CTTGCCTCGG GATGCTCGAA AGGCAATACC ATTCATGAAA TCGGCCATAC CATAGGGCTT 
TGGCACGAAC ACAGCCGTGA AGACCGGAAC GCATTTGTCA CCATTCACTG GGATAAAATC 
ATCGCAGGGT ATGAACACAA TTTCAATCAG CAGATAAGCG ATGGTGATGA TGTCGGCGCT 
TATGACTACG GATCCATTAT GCACTATCCG AGAACCGCCT TTTCAACTGA CGGCTCGGAA 
ACCATCACCC CGACCGATCC GTCCGCATCG ATAGGCCAGA GAACTGCTCT CAGCGCCGGT 
GACATTGCGG CAGCAAACTC TCTCTGCCCG ACCGTTTCGC TCTGTCCCGC AGCGCCGAAA 
ACCTGTCCCG GTGCACCGAT ACAGGTTTGC CCTGTTTCAC CGAAACTCGT ATGTCCTCCG 
GGAATAAAGC TCGCCTGTCC TCCGGGAATA AAACAACTTT GTCCTCCGGG AATAAAACAA 
AGTTGTCCCT CAGCACCAAT TCAGGTTATC TGTCCGCCAG GGATAAAACT CGCTTGTCCT 
CCGGGAATAA AAGTCACTTG TCCTCCTGTG CCGAAAATAC CGATCTGCCC ACCGTCACCG 
GTTCCGGGAT GTGCTGCCGG CCCGACAAAC AAACCGTGGG TCGGACCGGA GGGGTACACA 
ACAACCTATC GGCTTGATCC TGCGTCCGGA GCTTACTACA GCGATGAGGC CCCTCCTCCA 
GGCATGAATC AGATGCCTCC GGTTGTCATC AACATTAATT TTCACGGTTA TCAACCTCCT 
TCCATTCAAT CGGATTATGC ACAATACGAC CCCTCCGCCT ATGAAAATCA GGACTGGACA 
GCAACGGAGT ATCCTGATCC CGGAGAGGAA GCTGATGATT CGATAACAAA CGAAGAGAGC 
GAAGCACCGG AAGATTTCAA TCCTGAATGT TCGGAGTAA

Protein sequence

MARKKNGNTP QEYGEFSPSG KLRTAIIEGN TFGYKSVQYT DVDGMAMFEG DIILGKVADV 
DSKTEQRKRE IQQGVTLRGI TITGAKYRWP NCKVPYTIDT ALPNQSRVTD AIAHWEAKTK 
FRFILRTNAN ASSYPDWVTF RSGSGCSSYV GKQGGQQYIN LASGCSKGNT IHEIGHTIGL 
WHEHSREDRN AFVTIHWDKI IAGYEHNFNQ QISDGDDVGA YDYGSIMHYP RTAFSTDGSE 
TITPTDPSAS IGQRTALSAG DIAAANSLCP TVSLCPAAPK TCPGAPIQVC PVSPKLVCPP 
GIKLACPPGI KQLCPPGIKQ SCPSAPIQVI CPPGIKLACP PGIKVTCPPV PKIPICPPSP 
VPGCAAGPTN KPWVGPEGYT TTYRLDPASG AYYSDEAPPP GMNQMPPVVI NINFHGYQPP 
SIQSDYAQYD PSAYENQDWT ATEYPDPGEE ADDSITNEES EAPEDFNPEC SE