Gene GM21_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1961
Symbol
ID	8137295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2274521
End bp	2277343
Gene Length	2823 bp
Protein Length	940 aa
Translation table	11
GC content	55%
IMG OID	644869575
Product	hypothetical protein
Protein accession	YP_003021772
Protein GI	253700583
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	147
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAATGA TGTGGTGCAG GAAGGTTTCA TGGGCAGTAC TGTTACTGTT GACTGTGGTT 
GTCACCGCTT GTAGCAGCGG CGGAGGCAGT TCAACACCTC CAACCGCGAC CATTTCGGGA 
GCGGTCACCT TCCCGAGCAG CAGCGATGTA ATGGCGAAGC GGGCTGGCGC AGTTGTCACC 
GGGGATCCAG TAGTCGTTGA GATATATAGT CTCGACGGCA AACTAGCCGG TCCAGCGCAG 
GAAATCCAGT TCAACAACGG GCAGAACACG TACTCGTACT CGATTCCCGG TTTGCATACT 
GATACCGACT ATGTGGTCAA GGTAAAGCAC AATCTCCAGG TACTGAAGAA ACTTATTGAC 
AAGAAAAGCC TGGTCGCTCC GACTACACAG AACGTCAATG CCACAACGAC TGCCGCCGTC 
ATAATTGCTG AGCAGACGCT TTCCGCAGCG GGGCCTAAGG TGGTGCTCGG CGAAGAGCTT 
ACGGCCGGCT CGGGACCTTC TTCAGCCGCA GTCGCAACGC TGTCGCAGGA GATTGAAAAC 
CTGAAACCGA TGGAAATAGA AAATGCGATA GCCGATACGA TTGCAAACAG CAAGTCTGCC 
CTCAACAGCA AGACTGCCAC CTATGCCAAC ATCTACAACA TGGTCGTCGT GGCAGTTACC 
ACCGAAAATA TAGGGAGCGT AGATGCACTG CTAGCACCCA ACAGCACCGC CACTGTGACC 
GTGCCGACTT TCACAGTTGT CACAGTTGAT TCAAAGGAAA CGGTTGTACA GCAAACCGCC 
ACAGTTTCAA GCGAAACCGC CGCCTCCGTG GTCGAGGAAG CAACGAATTC CTATGAGCCT 
CCCGACACCA CCCTGGGAAT GGACGAATTC TATGTGACAC AGGCCAAGGC GTACCTTAAC 
AATCAGGACA TCGCCAACGC ATACAGAAAC TTCGAGCTCG CGCTGATGTC TAACAGCGAC 
AACGTCGATG CAAATGTCGG GGCGGCAATT ACCGGCGGCG TGATGCTCCT TGACGACGAG 
CAGGTAAAGA CGATCGTAGG GAAGTGGGGC TACGTCTATC CCACGGTAAA CGAAATAGTG 
CAGACGATCA GCCCGGTGGG GAACCCCTTC AACAACATGA CTTCGGCTGC TGCAACGGTG 
CCATTACTGG CCAAAACTGC GGCGAGTGCA CCGGTTGCTC CGGCTTCAGC CAATAAGATG 
CTGCAAGCCT TCAACGCACT CAAAGGCAAA CTGCCGCAGC AAAAGGCAGG CTTCAAATCG 
CTGGCCAAGG AACTCGGTCT GGTGGCGACC ACCGCTCCTA GCGTGAGCGA AATGCAGGCG 
GTCATCGACA ACGTCATCAT TCCGAAGCTG AACACCGTAA TAGCACGTCT TGCCAAGGCA 
GAAGGCAAAA GTGGCAACAC CTTTACCATC ACGGCACAGA TGCAGGGCAA CCCGCAGTAC 
GGCCAGGACG TGGTACTGGC TGATGCCGAA TATTACGTTC TCGATGCAGC AGTCAACGTG 
TTCCAGACCA TCTTCAAATT CACCACTGCC TATAACTTCG ACCTTCCTAC CGGGTACACC 
TACGACACCA TCTCCCAAGA CCCGCTGGCG ATGATCAACG ACCCGAAGGT CTTCACCTTG 
AAGGCGGACG GTGTTGCGAA GATGAGCGCG GCTCTCGACT ACGCTAAAGT CGCAGCTGTA 
AAAACCAAAG CAGCCTATGA TGTCCTCAAG CTGCGCGCCC TCGGCACCGG GGCCTTCGAC 
ATCGCAACCT GGAGCGACGC CGACAAGGCC AGCTTCGAAA AGGGGCTTGC CGAAGTTACC 
GCCGCCATGA ACGGAGCAAC CACCATCAGA TCCAACGGGA CCACCATCGC GGTGGATTTC 
ACCAAGTTCT TCACGAACCC GCTCACCAGG AAAAACCTGC CTACGCTTGG GTACGACGTC 
CCGAGGGATG AAGCCCTCTC CGTCAAGTAC GGTGCCCCCA CGGCTGCCGA AGTAAACTTC 
ACCGACGCAT GGAATACCGG ACTGCGCCCG GTCAAGTGCG ACATCCAACC CCTGGGCGAC 
CTGCCGGATT TCACCCTTAA CGGCATTTTC CCTGGCAACA CTGCTTCAAC CACCCTTGAT 
CGTGCTGGTT TCTCTGGAGC AGTCCCTTTC CTCTCCGGCA AGGTCCTCTC CGGAGTTCCC 
AACGAAGATA TCTGGGGTCA CGCCACCGAT GGTCAGTACA TCTACTATGC GACGCAGAAT 
GAAGACTGGT TTACTGTCAT CAAGAAAATC GATATAGCTA CCGGTGTTGT ATCGTTGGTG 
GCGACGCAAA GCGACAGTGG TAGCGTCGGC AGTCTTGTCT TCTATAACAA TGGCCTGCAC 
TCGGTCGACA CCAGCTACAG CCAAAATGGC CAGGTGGTAA CAGCTTCACC GATCATCATC 
GCCGGCAGTT CCTTCACAGT CGGCGCACCG GCTGCGTCGG TCGCCATAGA CGCCACTGGT 
TACACCTATG TAACTGCAGT AACCGCTGAC GGCAGCGACA TCTACTACGC GGTTCAAACC 
TGGAACCAGT TCACCTATAC CACTGACATG CAGGTCAGGA AGCTGAGCAA CCTGCAAACC 
GACACCCTCG TGTTTGCCGA GGAGGACGAA TATTTCGACA GCCTCTCAGT CTACGGCGGG 
TACCTGTACG CAGACGGTGA AAAGCGCAGT CTCACCGCAC CGTCCGTCAC CATAGCCAAA 
TACATAGATG TCGAGGACGC CGTGATGATC GGCGGTTACT TCTACGATGT CTACAACGGC 
AAGCTGACGA AATATGCCGG CTCCCCGAAC GGCGGCAGCG CCAAGACCGC CGCGCGTTTC 
TAA

Protein sequence

MGMMWCRKVS WAVLLLLTVV VTACSSGGGS STPPTATISG AVTFPSSSDV MAKRAGAVVT 
GDPVVVEIYS LDGKLAGPAQ EIQFNNGQNT YSYSIPGLHT DTDYVVKVKH NLQVLKKLID 
KKSLVAPTTQ NVNATTTAAV IIAEQTLSAA GPKVVLGEEL TAGSGPSSAA VATLSQEIEN 
LKPMEIENAI ADTIANSKSA LNSKTATYAN IYNMVVVAVT TENIGSVDAL LAPNSTATVT 
VPTFTVVTVD SKETVVQQTA TVSSETAASV VEEATNSYEP PDTTLGMDEF YVTQAKAYLN 
NQDIANAYRN FELALMSNSD NVDANVGAAI TGGVMLLDDE QVKTIVGKWG YVYPTVNEIV 
QTISPVGNPF NNMTSAAATV PLLAKTAASA PVAPASANKM LQAFNALKGK LPQQKAGFKS 
LAKELGLVAT TAPSVSEMQA VIDNVIIPKL NTVIARLAKA EGKSGNTFTI TAQMQGNPQY 
GQDVVLADAE YYVLDAAVNV FQTIFKFTTA YNFDLPTGYT YDTISQDPLA MINDPKVFTL 
KADGVAKMSA ALDYAKVAAV KTKAAYDVLK LRALGTGAFD IATWSDADKA SFEKGLAEVT 
AAMNGATTIR SNGTTIAVDF TKFFTNPLTR KNLPTLGYDV PRDEALSVKY GAPTAAEVNF 
TDAWNTGLRP VKCDIQPLGD LPDFTLNGIF PGNTASTTLD RAGFSGAVPF LSGKVLSGVP 
NEDIWGHATD GQYIYYATQN EDWFTVIKKI DIATGVVSLV ATQSDSGSVG SLVFYNNGLH 
SVDTSYSQNG QVVTASPIII AGSSFTVGAP AASVAIDATG YTYVTAVTAD GSDIYYAVQT 
WNQFTYTTDM QVRKLSNLQT DTLVFAEEDE YFDSLSVYGG YLYADGEKRS LTAPSVTIAK 
YIDVEDAVMI GGYFYDVYNG KLTKYAGSPN GGSAKTAARF