Gene GM21_4128 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4128
Symbol
ID	8139502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4716827
End bp	4718107
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	60%
IMG OID	644871743
Product	phosphate-selective porin O and P
Protein accession	YP_003023901
Protein GI	253702712
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3746] Phosphate-selective porin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	0.611373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACAGC ACACGGCAGT GGCAGTGGCA GGTTTTCTGG CGGCGATGGC GGTTGGGCAC 
GACGTCCAGG CGAAGAGCCT TGAGGACATC CTGAAAGAGA AAGGTGTCAT TACCGAGGCG 
GAGTACAAGG AGGCGTCGAA AGCGAAGCCT TACGATTACA AGCCGGGCAA GGGTTTCGTT 
TTCACTTCGC CGGACCAGAA GTTCCAGGTG CAACTGGGGG GACAGATCCA GGTGCAATAC 
GAACTCGACA ACTACGAAGC GTCCAACAAG CAGGACGTGA GCCAGTTCAA CCTGCGGCGT 
GTCAAGACCC TCCTGAGCGG CTACGCCTTT ACCAAGGACC TCACCTACAA GGCGACCTAC 
AACTGGGCCA ACGTGGTGAA GGACAACACC AAGGCCATGG AAGAAGTGAA CATGAAGTAC 
CGCGTCGCCG ACGAACTGAG GGTCATGCTG GGGCAGGAGA AGATCCAGTA CTCCAGGCAG 
TGGCTCACCT CCAACACGGC GCAGCAGTTC GTCGACGGTT CCTTCGTGAG GAACGCCTTC 
ATGCAGGGGT ACGATACCGG CATCAACCTG CACGGCGATC TCTGGAAGGG GGTGGTGAAG 
TACGATGCGG GGCTGTTCGG AGGCGCCGGC CAGAACACCA AGAACAAGAC CAACGACAAC 
GCCTACAACT TCAGGCTGGC GTTCAATCCC CTGGGTGACA TGAAGTACGG CGAGGGCGAC 
CTGGAGCACT CCGTGAAACC CCTGGTTTCC ATGGGAAGCA GCTACTACCT GAGCACGTTG 
AAAAAGACCG TCTCCGGAAC CGGAACCACT GCGACCTCCG CCATCGACAA CAGCAAGTCC 
AACTTCGTGA CCGACAGCAA CGGCTGGCTC GGCCAGGCGG TGAAAGGGAA GTATTTCGGG 
ACTGCCGCCG CCGAGAAAAT CTCCGTGGAT TCCTGGGAAG CGGACTTCGC CTGCAAGTGG 
CTGGGCGCCT CCATGCAGGG CGAGTACTTC TGGGGCAAGG CCCAGGGCGA GGCCTCGGGT 
AAGGAACTGA TCGCGAAGGG GGCCTACGTG CAGGCCGGGT ACTTCGTGAT CCCGAAGCGC 
CTGGAGCTTG CGCTCCGATA CGCCTGGATG GATCCCAACC GCGGGCTTGC CAACGACGCC 
GTTTCCGAGA TCCAGGGAGG GGTCAACTAC TTCCTCTACG GCAACAACCT GAAGATCCAG 
GGCGACGTGG GCAACCGCCA CACCTACAAG AACAAGTCCG ACGACCTGGT GGCGCGCGCC 
CAGGTGCAGC TGCTCTTCTA G

Protein sequence

MRQHTAVAVA GFLAAMAVGH DVQAKSLEDI LKEKGVITEA EYKEASKAKP YDYKPGKGFV 
FTSPDQKFQV QLGGQIQVQY ELDNYEASNK QDVSQFNLRR VKTLLSGYAF TKDLTYKATY 
NWANVVKDNT KAMEEVNMKY RVADELRVML GQEKIQYSRQ WLTSNTAQQF VDGSFVRNAF 
MQGYDTGINL HGDLWKGVVK YDAGLFGGAG QNTKNKTNDN AYNFRLAFNP LGDMKYGEGD 
LEHSVKPLVS MGSSYYLSTL KKTVSGTGTT ATSAIDNSKS NFVTDSNGWL GQAVKGKYFG 
TAAAEKISVD SWEADFACKW LGASMQGEYF WGKAQGEASG KELIAKGAYV QAGYFVIPKR 
LELALRYAWM DPNRGLANDA VSEIQGGVNY FLYGNNLKIQ GDVGNRHTYK NKSDDLVARA 
QVQLLF