Gene GM21_4105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4105
Symbol
ID	8139479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4686818
End bp	4688152
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	65%
IMG OID	644871720
Product	hypothetical protein
Protein accession	YP_003023878
Protein GI	253702689
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	117
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGTTA CCATCTTCAC ATCCCCCATT ACCCCCATCA GGAGCGGCCG TGATTCCCGC 
AGAATGGCCG CGCCGCCACC TTCCCTCGCC CGCAGCCTAA GGCGCCTTGC CCGCTTTTGG 
CTTGCAGCCT GCCTGGCACT GCTCCTGCTC GTTCCCCCCG GCGCCCACGC TGCTCCTTCG 
GAAACCTCCG CCACCCTCTA CTTCTTCTGG GGCGTCGGCT GCCCCCACTG CGTGAAGGCG 
AAGCCCTTCC TGGAAGAGCT GAAAACGAAG TACCCGACCC TGCGCGTCGA GTCCCTCGAG 
GTGCTGGAAA ACCGCGAGAA CCTTCCCCGG CTGATGGCGA TGGCCCGCGC CCGCCACAAG 
GAGGCGACGG GGGTGCCGGT CTTCATCGTC GGCCAGGAGA TGTTCAGCGG CTTCTCTGCC 
GAAACCGCGG CGGAGGTGGA ACAGGCGGTG CGCCTGGCCG TGCAGCCGGT CGCGCCGCAG 
GAACAGGCCG CGAAACCCGC CCCCACCCCT TCCGTCAGGC TCCCGCTCCT GGGACCGGTC 
GACGCGCAAA GCCTGTCGCT TCCCGTTTTC ACCGTCGCGG TCGCGCTTTT GGACAGCTTC 
AACCCCTGCG CTTTCTTCGT GCTCTTCTTC CTGTTGAGCC TGTTGATCCA CGCCCATTCG 
CGGCGCCGCA TGCTTCTCAT CGGCGGGCTC TTCGTCTTTT TCTCCGGGCT CGTCTACTTC 
GTCTTCATGG CGGCCTGGCT CAACCTCTTC CTCATCACCG GCGGGCTTCC CGCCATCACC 
TTCGCCGCGG GAATCGTCGC GCTCTTCGTC GGCGCGGTGA ACGTCAAGGA ATTCTTCTAT 
TTCGGGCAGG GGGTCTCGCT CAGCATCCCG GAACAGCAGA AACCGAAGCT CTTCGCCCGC 
ATGAGGAGGC TCCTCAGGGC GGATTCGCTC CCCTCCCTTT TGGCCGGGAC CACGGTGCTG 
GCTCTCGCCG CCAACAGCTA CGAGCTCCTC TGCACCGCCG GCTTTCCCAT GGTCTTCACC 
CGCATGCTCA CCCTGAGGGA ACTCTCCACC TACGGCTACT ACGCCTATCT TGCCTTCTAC 
TGCACGATCT ACGCGCTCCC CCTGGCGGTC ATCGTCGCGA TCTTCACGGT GAAGCTCGGT 
GAACGGAAGC TGACAATATG GCAGGGACGG GTGCTGAAGC TGGTCTCGGG ATTGATGATG 
CTGGGGCTGG GGCTCGTGCT GCTCATCGAC CCGGCCCTGC TGAACAACCC GTTGGCCTCG 
GCTGCGCTTC TCGGGGGGAC GCTGACCACG ACGGCGCTTT TGGCGGCTTT CGCCAGAAAA 
AGGGGCGCGG GTTAG

Protein sequence

MPVTIFTSPI TPIRSGRDSR RMAAPPPSLA RSLRRLARFW LAACLALLLL VPPGAHAAPS 
ETSATLYFFW GVGCPHCVKA KPFLEELKTK YPTLRVESLE VLENRENLPR LMAMARARHK 
EATGVPVFIV GQEMFSGFSA ETAAEVEQAV RLAVQPVAPQ EQAAKPAPTP SVRLPLLGPV 
DAQSLSLPVF TVAVALLDSF NPCAFFVLFF LLSLLIHAHS RRRMLLIGGL FVFFSGLVYF 
VFMAAWLNLF LITGGLPAIT FAAGIVALFV GAVNVKEFFY FGQGVSLSIP EQQKPKLFAR 
MRRLLRADSL PSLLAGTTVL ALAANSYELL CTAGFPMVFT RMLTLRELST YGYYAYLAFY 
CTIYALPLAV IVAIFTVKLG ERKLTIWQGR VLKLVSGLMM LGLGLVLLID PALLNNPLAS 
AALLGGTLTT TALLAAFARK RGAG