Gene Anae109_2263 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_2263
Symbol
ID	5375620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	2569724
End bp	2570734
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	74%
IMG OID	640843781
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_001379449
Protein GI	153005124
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.164031
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0202941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGAGCGG GGGCTTGCAC CCACACGCGC TCGAAGGGCG GCCGCGCCCG CCGCCCAGGG 
AATTCGGGGG TCGTCACCCC CGTTGGACCG ATCGTGCTCA AGACCCGACT CCTGTCGAGC 
CTCGGCGGGG CCGCCGCCGT CGCCGGCCTC TTCTTCGCCG CCTCTCCGCT GCTCGGGCTG 
TCGCCCGCCG AGCGCGCCAC CAATCCGCGC GCGGACACGG TCCACAAGGT GTTCCCGAGC 
GCGGTGCGCA TCCAGATCTC CGCGGCGGGC GAGGTGGTCC GCAGCGCCTC CGGCATCGCC 
TTCGCGCGGA GCGGCGAGCG GACGTACGTC CTGACGAACG CCCACGTCGT CGCGAACAAG 
CGGACCTGGA AGGACCCGGT GCGCGTCGAG GTGCTGCCCA GCGAGGGCCA GGGCCGGGTC 
CTCGCGAAGG TGGTCGCGAC GGGTGCCCTG CCGGACACCG ACATCGCCGT GCTGGAGGTG 
CAGGGCTCGC TCCCCGTGAC GCCGCTCGGG CCCGACGACG AGCTGGAGCT CGGCGACGAC 
CTCGTCGTGA TCGGCGCGCC GTTCGGGAAG GGGCTCTCCG TCGCGGCGGG GATCGTCTCG 
CAGGTGGAGT ACGAGTTCCT CGAGAACGCA GCGGCGCCGC GGCGCGCCAA GTCGCTCAAG 
ACGGACGCCG CCATCGGCTA CGGCAGCTCC GGGGGCGGCG TGTTCGACGT GCCGCGCGGC 
CGGCTCATCG GCCTGGTCGA GGGCTATCGC ACCGCGCGCG TCGAGTTCGG CAAGGACGCG 
AACCAGTACG CGTTCGACGT GCCCATGCCG GGCGAGACGT TCGTCGCCCC GGCCGCGAAG 
ATCCGGCGCT TCCTCGCGGA CAAGGGGTTC GCGCATCTCG CCGATGGCCG TCCGGACGAG 
GTCGCCGCGC GCGAGAAGGA CCTTTCGCAG GGAGAGCTCG CCTCGAAGCA GGGCGAGGTG 
GCCGCGCGCG CTCAACCGGT CGCGCTGCCG GCCGCGCCCG CGGGCATGTA G

Protein sequence

MRAGACTHTR SKGGRARRPG NSGVVTPVGP IVLKTRLLSS LGGAAAVAGL FFAASPLLGL 
SPAERATNPR ADTVHKVFPS AVRIQISAAG EVVRSASGIA FARSGERTYV LTNAHVVANK 
RTWKDPVRVE VLPSEGQGRV LAKVVATGAL PDTDIAVLEV QGSLPVTPLG PDDELELGDD 
LVVIGAPFGK GLSVAAGIVS QVEYEFLENA AAPRRAKSLK TDAAIGYGSS GGGVFDVPRG 
RLIGLVEGYR TARVEFGKDA NQYAFDVPMP GETFVAPAAK IRRFLADKGF AHLADGRPDE 
VAAREKDLSQ GELASKQGEV AARAQPVALP AAPAGM