Gene GM21_0723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0723
Symbol
ID	8136038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	867654
End bp	868700
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	66%
IMG OID	644868340
Product	glycosyl transferase family 2
Protein accession	YP_003020555
Protein GI	253699366
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.00000000000000115324
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGTCCTTTG ACGAGCGCCC CGAGCTGTCG GTCGTCGTGC CGGTGTACAA CGAGGAGGGG 
AACCTGCTTT CCTTCCTGGA GGCGATGGCG AGGCAGCGCG AGTTGCACCT GGAGGTGATC 
ATCTCCGACG GGGGGTCCAG CGACGGCGGC ATCGGGGTTG CCCGCGGCTT CGCGGCTGAC 
GCCCCCTTTG CGGTGACGAT AATCGAGGGG GCCAAGGGAA GGGGAGCACA GTTGAATCTA 
GGGGCGGACG CGGCGCGCGC CCCCCTTTTG CTCTTTCTCC ACGTGGATTC AAGGTTCGAC 
GACCCGCTGG CGCTCAGAAA GGCCGTGGAC GCGCTCGAAA AAGCGCGCCG GGAGGATAGA 
AGGGTCGCCG GCCGCTTCTC CCTCCGCTTC GATTTCGAGG GGGCCGCCCC GCTCCCCTAC 
CGCTTCTACG GTGCCAAGGC GACCTTGGAC CGCCCCGGAT GCACCCACGG CGACCAGGGG 
TTCATGATGG GGAGCGACTT CTTCAACGAG CTCGGCGCCT TCCAGAGCGC GCTCCCGCTC 
ATGGAGGACA CCTTCCTCGC CGAGAGGGTG AGGGAAAAGG GGAGCTGGAT CCTCTTCCCA 
GCCCGCATCG CCACCTCGTC CCGCCGCTTC CTCACGGAGG GGCTCCTCCC CCGGCAGAGC 
CTGAACGCCA TCCTGATGAA CCTGGCCACA CTCGGGCACC TCTCGCTGAT CGAATCCCTG 
CGGGAAAGCT ATCGCAGCCA CGACGCGGCG AAGCGTCTGG AGCTGCGCCC CATTCTGCAC 
CCCCTCAACC TCAAGATGGC GCAACTGCCG CGCCGGGAGC GGTGGCGGCT TTGGTACCGG 
ACCGGGAGCT ACGTGAGGAG CAACGCCTGG CAGATCGCCT TTTTTCTGGA TGTGGTGACG 
GGGGGGGCGG GGGAAGGGAA GGGGGGAAGA TTTCTCTCGC TGCACGACCG CCTTTTGGGG 
CGGCTCATCG ACAACAGGGC CGGCAACTGC GCTGCGGCCC TTTTCACCTG GTTCTGGTTT 
CGGACAACCT TGCGCCTTTG CCGCTAG

Protein sequence

MSFDERPELS VVVPVYNEEG NLLSFLEAMA RQRELHLEVI ISDGGSSDGG IGVARGFAAD 
APFAVTIIEG AKGRGAQLNL GADAARAPLL LFLHVDSRFD DPLALRKAVD ALEKARREDR 
RVAGRFSLRF DFEGAAPLPY RFYGAKATLD RPGCTHGDQG FMMGSDFFNE LGAFQSALPL 
MEDTFLAERV REKGSWILFP ARIATSSRRF LTEGLLPRQS LNAILMNLAT LGHLSLIESL 
RESYRSHDAA KRLELRPILH PLNLKMAQLP RRERWRLWYR TGSYVRSNAW QIAFFLDVVT 
GGAGEGKGGR FLSLHDRLLG RLIDNRAGNC AAALFTWFWF RTTLRLCR