Gene GM21_3083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3083
Symbol
ID	8138433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	3575519
End bp	3576709
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	60%
IMG OID	644870687
Product	major royal jelly protein
Protein accession	YP_003022869
Protein GI	253701680
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.058624
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAG AAGGTTTGCT ATGGCCGCGG GGAGTCCAGC TGAAGACGAA GCCAAGTACT 
GCAATTGCAA CAATGGCAAG ATCGGTTTGC CTCTGCTTAC TAACAATCTC GATCTGCCTC 
GGATGTGCCC ATAAGCAAAC GCCGCAGTCG GACGGGCTGA AGAGCGTCCC GGACCGGCTG 
AAGACCATAG CTACCTTCAG GGGAGCACAG GTCACCGGGG TTACTTCGAC CGATACCGGT 
AGACTCTTCG CCAATTTCCC CCGATGGCGC GAAGGGGTCC CCTTCTCCGT AGTCGAGGTG 
TCGCCTGACG GCTCTTTTAC CCCTTACCCT GACGCGGAGT GGAACCGGTG GGAGGGGTAC 
CCGCAGCCCG ATCGTTTCAC CTGCGTGCAA TCGGTGGTGG CGCACGGGGA TTCTCTCTAC 
GTGCTTGACC CCAGCAATCC GCAGTTCGCC GGCGTGGTCG GCTCGGCAAA GCTTTTCGTC 
TTCGACCTGA AGACGAACCG GTTGAAGCGC AGGTACGAGT TCCACAACGG CGTCGCGCCG 
GAAAGATCGT ACCTCAACGA CCTGCGCATC GACGATGCCG CCGGAAAGAT CTATATCACC 
GACTCAGGCC TGGGTGCGAT CATAGTTGTC GACACAGCTA CGGGCAACGT CCGCCGGCTT 
CTGGCGCACC ATGCTTCAAC CAAGGCTGAG GAGATCACAC TCAGGATCGA CGGCAAGGAG 
TTCCTGCGCA ACGGCAAGCC TCCGCGCATC CATTCCGACG GCATCGAGCT CGACCGGAAA 
AACGGATACC TCTACTACCA CGCCCTCACC GGCTACCATC TCTACCGGGT CCCCACCAGC 
GCGCTCGCGG CGGCGTTTTT CGATCCGAGA CTGGAAGCAG CCCTTGAGGC GAAGGTGGAA 
GATCTAGGAA AGACTCCCGC TCCCGACGGG ATGATGTTCG ATGCGGTGGG AAACCTCTAT 
ATGGGCGACC TGGAGCACGA TGCCATCGTC TACCGCACCC CGGCCGGTGA GATACTGACG 
CTGGTCCAGG ACCCGCGCAT TCGCTGGGCC GACACCTTCA CCATTGATCC AAACGACTCC 
CTTATCTTCA CGGCGTCCAG AATTCACCAG GTACCGCAGA GCGGCGGAAT AGAGGAGATG 
GAATTTCCGA TCTATTCCCT GCAGCTACCT CCCTCCGCCG CGCCTCAATG A

Protein sequence

MAKEGLLWPR GVQLKTKPST AIATMARSVC LCLLTISICL GCAHKQTPQS DGLKSVPDRL 
KTIATFRGAQ VTGVTSTDTG RLFANFPRWR EGVPFSVVEV SPDGSFTPYP DAEWNRWEGY 
PQPDRFTCVQ SVVAHGDSLY VLDPSNPQFA GVVGSAKLFV FDLKTNRLKR RYEFHNGVAP 
ERSYLNDLRI DDAAGKIYIT DSGLGAIIVV DTATGNVRRL LAHHASTKAE EITLRIDGKE 
FLRNGKPPRI HSDGIELDRK NGYLYYHALT GYHLYRVPTS ALAAAFFDPR LEAALEAKVE 
DLGKTPAPDG MMFDAVGNLY MGDLEHDAIV YRTPAGEILT LVQDPRIRWA DTFTIDPNDS 
LIFTASRIHQ VPQSGGIEEM EFPIYSLQLP PSAAPQ