Gene GM21_0186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0186
Symbol
ID	8135489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	221272
End bp	222258
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	63%
IMG OID	644867805
Product	serine/threonine protein kinase
Protein accession	YP_003020029
Protein GI	253698840
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.00000000000000117305
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGAAA CATCGCATCC CTTTTCCACC CTCACCCCCA ACTTCATCAT GGACGCCGTC 
GAAAGCCAGG GATTCCGTTG CGACTGCCGC ACTTCCGCCT TGAACAGTTA CGAGAACCGC 
GTGTACCAAG TGGGGATCGA AGAAGAAAAA CCGCTGATCG CGAAGTTTTA CCGCCCCGGG 
CGCTGGAGCG ACGAGCAGAT CAGGGAGGAG CACCAGTTCT GCCTCGAACT GGCGGAACAC 
GAGCTGTCCG TGGTCGCTCC TTGGATGAAC CCAGCTGGCG ATACCCTCTT CCATTTCGAC 
GGGTTCCGGT TCGCCCTCTA CCCGCGCCAA GGGGGGCACG CCCCCGAGTT CGACAACGAC 
GAGAACCTGG CGATCCTCGG TAGAATGCTG GGGCGCATTC ACAGCATCGG CGCCATACGC 
CCCTTCAAGG AGCGCCCCAC CCTGGAAAGC CGCAGCTTCG GGCACGACAG CGTAGCCCTC 
ATCAAAGAAC GCTTCATCCC TGAGGAATAC CGCGCAAGCT ACACGGCGGT CACCGACCAG 
CTGCTTGCCG CCATCGATGC GGCCTTCGCA CAGACGCAGG GGGTGACCCA GATCAGGGCG 
CATGGAGATT GCCATGCCGG CAACATCCTG TGGCGGGACG GCGCGCCGCA TTTCGTCGAC 
TTCGACGACG CCCGCATGGC GCCGGCGGTG CAGGACCTCT GGATGATGCT TTCGGGTGAG 
CGGCCGCGCC AGCTGGTGCA ACTGGAACAA CTGGTGAAGG GATACACCGA ATTCCGCGAC 
TTCCACCCCG GAGAACTCAT GCTGGTGGAG CCGCTGCGCG CCCTGCGCAT GCTGCACTAC 
AGCGCCTGGC TGGCCCGGCG CTGGGAGGAT CCCACCTTCC CTATCACCTT CCCCTGGTTC 
AACACGGTGC GCTACTGGGG CGAGCACATC CTGCAGCTGC GCGAGCAGTT GTCTGCGCTC 
GACGAGCCGC CCCTGGAACT TCCTTGA

Protein sequence

MKETSHPFST LTPNFIMDAV ESQGFRCDCR TSALNSYENR VYQVGIEEEK PLIAKFYRPG 
RWSDEQIREE HQFCLELAEH ELSVVAPWMN PAGDTLFHFD GFRFALYPRQ GGHAPEFDND 
ENLAILGRML GRIHSIGAIR PFKERPTLES RSFGHDSVAL IKERFIPEEY RASYTAVTDQ 
LLAAIDAAFA QTQGVTQIRA HGDCHAGNIL WRDGAPHFVD FDDARMAPAV QDLWMMLSGE 
RPRQLVQLEQ LVKGYTEFRD FHPGELMLVE PLRALRMLHY SAWLARRWED PTFPITFPWF 
NTVRYWGEHI LQLREQLSAL DEPPLELP