Gene GM21_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0033
Symbol
ID	8135332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	42772
End bp	44580
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	64%
IMG OID	644867650
Product	ABC transporter related
Protein accession	YP_003019878
Protein GI	253698689
COG category	[V] Defense mechanisms
COG ID	[COG1132] ABC-type multidrug transport system, ATPase and permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTTCG GCGGGATCTA CGAGGACGAG ATAGTCGGCA AGATGTACGA CCGGCGGCTG 
ATGGGGCGCT TCTTCCCCTA TCTGCTGCCG TATCGCCGCC TCATCGCGGC CGCGCTCATA 
CTCCTCCCTT TCGTGGCGGC GGCCAAACTG GTGCAGCCCT GGATCCTCAA ACTGGCGATC 
GACGACCACA TAACCAAGGG GGTCATGGCG GGATTGCCGT CATTGGCGGC GCTTTTCCTG 
GGGGTCATCC TCGCCGAGTC GCTCCTCATG TTCGCGCAGG TTTACCTCTT GCAGTACGTG 
GGGCAGAAGG TGATGTACGA CATCCGGGTG GCGCTCTTCT CGCACCTCCA GCGCCTCTCG 
GCCCGCTTCT TCGACCGGAC CCCGGTCGGG AGCCTCGTCT CCAGGCTCAC CAGCGACATC 
GAGGTGCTGG GGGAGATGTT CGCCGCCGGG ATCGTCACCG TGGTGGGGGA TGTCCTGGTC 
CTGGCGGGGA TCGTCGCCAT CATGCTCTTC ATGAACGTGA AGCTGTCGCT GGTAACCTTC 
TCGGTGCTCC CTTTCCTGGT CTGGGCTGCC TTCTCCTTCA GGAAGTGGAT GCGCGCGGCC 
TTCAGGCAGG TGCGGGCCAG GCAGAGTAAC TTAAGCGCCT TTCTGACCGA GAGCATCGGC 
GGCATGGCGG TGGTGCAACT CTTCAACCGG GAGAAGGACG AGGCGCGCGA ATTCCGCAGG 
CTGAACACGG CGTACATGGA ATCGAACCTC CCGGTCATCA CCTGGGACGC CGCGCTTTTC 
GCGGTGGTGG AGACGCTCTC CTCGGTGGCC GTGGCGCTCA TCATCTGGTA CGGCGGAGGG 
GAGATCGTCA GGGGGACCCT TTCCTTCGGC GCGCTGGTCG CCTTCATCCA GTACATCGAG 
CGCTTCTTCT CCCCGATCCG CGATCTTTCC GCCAAATACT CGGTGATGCA AGGGGCGATG 
GCCTCCCTGG AGCGGATCTT CACGCTTCTG GACAACCAGG CGCTGGAGCC CGCCCTGCTC 
AACGAAAGGA GCTCCGCCGA AATAGAGAAG GGGACTCCCT GCCAGGCGAT GCCCTCCGAG 
GCCGGGAGCA GCATCTGCTT CAACGACATC TGGTTCGCCT ACAGCGAGGA CGCATTTGTG 
TTGAAGGGCT TCTCCCTGCA GATGAGGCGC GGCGAGAAGG TGGCGCTGGT CGGAGAGACC 
GGCGGCGGCA AGACCACCGT GACGCGTCTT CTCTCCCGGC TCTACGACGT GAACCGCGGC 
TCGATAACCG TCGACGGCGC CGACATCCGG GACATCCCGC TGAAGACCCT CAGAAAGCGG 
ATCGGGGTGG TGCTGCAGGA TCCATATCTC TTTTCCGGGA CCATCGCCTA CAACATCTCG 
CTCGGGGACC CGGAGGCGCT GAAGCGCGTG GAGCAAGCCG CCGCGGTGGT CGGCGCGGAC 
CGTTTCATAA GAGAGCTTCC CAAGGGGTTC GAGGAGGAGG TACGGGAGCG CGGGGTGAAC 
TTCTCGGCCG GGGAGCGGCA ACTGATCTCC TTCGCCCGCG CGGTGGCCTT CGACCCGGAC 
ATCCTGGTCC TCGACGAGGC GACGGCGAGC GTGGACACGG CGAGCGAGCG CCTGATCCAG 
CGGGGGCTGG AGGGGTTGAT GCAGGGGAGG ACCACGCTGG TGGTAGCGCA CCGGCTTTCC 
ACCATCCGCG ACGCCGACCG CATCGTGGTC ATCCATCACG GCGAGAAGAT GGAAGAGGGT 
AGCCACGCGG AACTGATGGA GGCGAAGGGC GTCTACTACA GGCTTTACCA GCTGCAGTTC 
AAGGACTAG

Protein sequence

MHFGGIYEDE IVGKMYDRRL MGRFFPYLLP YRRLIAAALI LLPFVAAAKL VQPWILKLAI 
DDHITKGVMA GLPSLAALFL GVILAESLLM FAQVYLLQYV GQKVMYDIRV ALFSHLQRLS 
ARFFDRTPVG SLVSRLTSDI EVLGEMFAAG IVTVVGDVLV LAGIVAIMLF MNVKLSLVTF 
SVLPFLVWAA FSFRKWMRAA FRQVRARQSN LSAFLTESIG GMAVVQLFNR EKDEAREFRR 
LNTAYMESNL PVITWDAALF AVVETLSSVA VALIIWYGGG EIVRGTLSFG ALVAFIQYIE 
RFFSPIRDLS AKYSVMQGAM ASLERIFTLL DNQALEPALL NERSSAEIEK GTPCQAMPSE 
AGSSICFNDI WFAYSEDAFV LKGFSLQMRR GEKVALVGET GGGKTTVTRL LSRLYDVNRG 
SITVDGADIR DIPLKTLRKR IGVVLQDPYL FSGTIAYNIS LGDPEALKRV EQAAAVVGAD 
RFIRELPKGF EEEVRERGVN FSAGERQLIS FARAVAFDPD ILVLDEATAS VDTASERLIQ 
RGLEGLMQGR TTLVVAHRLS TIRDADRIVV IHHGEKMEEG SHAELMEAKG VYYRLYQLQF 
KD