Gene GM21_3768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3768
Symbol
ID	8139142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4342609
End bp	4344039
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	62%
IMG OID	644871387
Product	Carbohydrate-selective porin OprB
Protein accession	YP_003023545
Protein GI	253702356
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3659] Carbohydrate-selective porin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	112
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTCA AAAAGATTCC GGTAGCAACT GCTTTCTTGT TGGGGAGCCT TTTGCTTTCT 
TCAGGAGCGG CGTTCGCGCT GCATCCGGAG CTGGTGGTTC CGGAAAGGGT GGAGCTGAAG 
CACAAGGCCT GCCAGGAGAT TGTTCGGCTC GGAGCGAAGT ACAAGGTGGA GGGGCTCTTT 
ACTCCGGAGT TCCTGGAGGG AAAGCAGCAC GACTGCAGCC GGATCGATGT TGCGCTGGCG 
GTGCAGCTGC TGACCGAGAA AATGGCGGAA AAAGCGGTGA AGGAGGGGAA CCAGGCCGTG 
GACAGGGAAG ACCTGCTGCT GCTCGCGGAC CTGAAGGAGG AACTGCGCGC CGAGATGCTT 
CTGGTAGGTA CCCGGACCTT CCAGTCCCGC TACCAGGACC TGGGCACCAG GTTCACCGCC 
CTCACAAAGA ACATCTCCCT CAGCGGCGGC ATGGTCGGCG TGCTCCAGGG AACCGTCGGC 
CACAGCCCTA AGAATCACGC GGACACCGTG GGACGCGCCG ATCTGGTCTT CAACTTCAAG 
GTGGGGGAGA ATACCATCGC CGTATTCGAC CTCGAAGCGA CCGGTGGCGA AGGGATCGAC 
AACACCGCCG GCATCAACTC CTTCTCGGGC CTGAACGGCC TGGCCGGATC CACCGGCGAC 
CGGGTCAGAT TTCGCGAGGC TTGGGTCGAG CATTCCGCGT TCGACGACCG GATGGTGCTG 
ACCGCCGGCA AGGTCGACCT TTCCAACTAC TTCGACTCCA ACGCGGTGGC AAACGACGAG 
ACTGGGCAGT TCCTGGCCGG CGCCTTCGTC CACTCCGCCG TGCTCCCCTT CCCCGCTAAC 
GGGCCGGGTG CGAGGGTGGC CGCGAAACTG ACCGATTCCC TCGTCGTAGG CCTTGGCTAT 
GGCAGCGGCG ATGCCGACAG CGAAGACAGC TCCGACTCAG CCGACATCTT CAGCCACGGC 
TTTGGCATCG CGGAACTCGA CTATAAAGTC AAGGCCGGGA ATCTGGAAGG CGACTACCGT 
CTTTACGCGG CCTTGGACGG AGCAGTCGCA GGCAAGCTGG AGCCGAAAAA CGCCTGGAAC 
TTCGGCGTGA GCCTCGACCA GCAGCTGACC GACAAGCTGA CCCTCTTCGC CCGCTACGGT 
CAGCGCGACA AGGATGTCTA CGAGGTCCAA AAGGCCTGGA GCGCAGGCGG ACAGTACACA 
GGGCTTTTCC CTTCCAGGAA GGACGACGTT CTCGGCGTGG CCTACGGCCA GATCAAGGCG 
CACGCATCCA TCGCCGACAC CCAGGAGAAA CTGACCGAGC TCTACTACAA CTTCAAGATA 
AACGAGCAGA TCGAGATCGC ACCGGTGGCG CAGTACCTGG TCCACCCGGC CGGGATGCGC 
GGCAACGACG ACGTGCTGGC GCTGGCGCTG CGTACCCGGA TCAGCTTCTG A

Protein sequence

MNFKKIPVAT AFLLGSLLLS SGAAFALHPE LVVPERVELK HKACQEIVRL GAKYKVEGLF 
TPEFLEGKQH DCSRIDVALA VQLLTEKMAE KAVKEGNQAV DREDLLLLAD LKEELRAEML 
LVGTRTFQSR YQDLGTRFTA LTKNISLSGG MVGVLQGTVG HSPKNHADTV GRADLVFNFK 
VGENTIAVFD LEATGGEGID NTAGINSFSG LNGLAGSTGD RVRFREAWVE HSAFDDRMVL 
TAGKVDLSNY FDSNAVANDE TGQFLAGAFV HSAVLPFPAN GPGARVAAKL TDSLVVGLGY 
GSGDADSEDS SDSADIFSHG FGIAELDYKV KAGNLEGDYR LYAALDGAVA GKLEPKNAWN 
FGVSLDQQLT DKLTLFARYG QRDKDVYEVQ KAWSAGGQYT GLFPSRKDDV LGVAYGQIKA 
HASIADTQEK LTELYYNFKI NEQIEIAPVA QYLVHPAGMR GNDDVLALAL RTRISF