Gene GM21_4122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4122
Symbol
ID	8139496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4705709
End bp	4706908
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	60%
IMG OID	644871737
Product	phosphate-selective porin O and P
Protein accession	YP_003023895
Protein GI	253702706
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	0.556284
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAATA TGCCAAAGTT ATCGACTGTC GCCGGGGCGA CCTTAGGGGT AGTCCTCATG 
GCGGGGACGG CCTTTGCCGG CCCGAAAATG GTCTTCGGCC CCAACGACGA GGGGGCGCTC 
CAGATCGACT ACAAGGGGCA GTTCCAGATG ACCGTCCGGG ACATCGGGTC GGGCGAGAAC 
AACGACGACA ACACCATGAA CTTCAACTTC CGCAGAAACC GTCTCGCCCT CATGGGGAAA 
TACGGCGACA ACATGTCCAT CTACGTCCAG ACCGAGTACG TGGACGACGC CAACATCACC 
CCGTTCGATG TGGCCGATAC CGACCAGGGT TCGGAGTTCC AGTTCCTCGA TGCGGTGATG 
CGCTTCAAGA TCAACGACGC GCTGCGCGTG AACGTCGGCA AGTTCAAGTA CAACCTCTCC 
CGCGAGAACC TTGAGGCATG CGAGATGCCG CTCACCCTGG ACCGCTCGCT CTTCATCCGC 
GCCCCCTACA CCACGACCCG CGACACCGGT GTGGCCGTCT GGGGTAACCT CTTCGACGAC 
ATGTTCCAGT ACCGCGTCGA TGCCATGGAA GGGCGCAAGG CCGTGTCCGG CGTCACCGCG 
CCGGCCTCGA ACTTCAGGTA CTCAGCACGC GCTCACGTGA CGCTCCTCGA CCCGGAGAAC 
GACTACGGCT ACAAGGGGAC CTATCTCGGC AAGAAGAAGG TGGCCACCAT CGGCGCCGCC 
TACCAGTTCG AGCCTGAGGT CGCCTACGGC AACACGTTGA CGCAGACCGA CAAGAAGGAT 
TACAAGGCCT GGACCGTCGA CGGCTTCGTC GAGTATCCGA TCGAAGGGGT GGGTACCGTC 
ACCGCGTCGG CGGCCTACGA GGATGTCGAT CTGGACGACG CGTACCAGGG GGACAACCCC 
GACTCACTGG TTACCGGCCT CAACGGCGAG AAGAACGGCT ATTACGTGAA GGGTGGTTAC 
ATGCTCCCCA CCATGCCGCT GCAGTTCTTC GTCAGGTACG AGAGGTGGCG CTTTGCCGAG 
TTGAACGGCG TCTTCGACCA GAGGATCGAC TGGTACGGCG GCGGGTTCAA CTACTACCTG 
CGCAACCAGA ACCTGAAGCT CACCTTCGAG GCTAACTCTA CAGGCTTCAA CAAGGGTGGG 
GGAACCGAGA CCACTGAAGA CTTCATGACC TACATAACGC AGCTGCAGCT TATCTTCTAA

Protein sequence

MLNMPKLSTV AGATLGVVLM AGTAFAGPKM VFGPNDEGAL QIDYKGQFQM TVRDIGSGEN 
NDDNTMNFNF RRNRLALMGK YGDNMSIYVQ TEYVDDANIT PFDVADTDQG SEFQFLDAVM 
RFKINDALRV NVGKFKYNLS RENLEACEMP LTLDRSLFIR APYTTTRDTG VAVWGNLFDD 
MFQYRVDAME GRKAVSGVTA PASNFRYSAR AHVTLLDPEN DYGYKGTYLG KKKVATIGAA 
YQFEPEVAYG NTLTQTDKKD YKAWTVDGFV EYPIEGVGTV TASAAYEDVD LDDAYQGDNP 
DSLVTGLNGE KNGYYVKGGY MLPTMPLQFF VRYERWRFAE LNGVFDQRID WYGGGFNYYL 
RNQNLKLTFE ANSTGFNKGG GTETTEDFMT YITQLQLIF