Gene GSU3271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3271
Symbol
ID	2687666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3588092
End bp	3589501
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	63%
IMG OID	637127963
Product	hypothetical protein
Protein accession	NP_954311
Protein GI	39998360
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3659] Carbohydrate-selective porin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0437682
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGAACA TGAAGAAGGT GTTGGTGGTG GGTCTCGCGC TGCTCGGGAG TCTGGTCGTC 
GGCTCCACGG GAGCCCAGGC GCGCAATCCG GAATTTGCTC TTCCCGAGAA GGTCGAGGTA 
AAGCACAAGG CCTGCCAGGA GATCTTACGG CTTGCGGCCA CGTATCAGGT GGAGGGGTTG 
TTCTCAAAGG AATTCGAGGC GGGCCAGGTG TGCTACACCC GCACGGACCT GGCGGTGGTG 
CTGGAGCTGC TGACCGAGAA ACTGGCGGAG AAAGTGGTGA AGGAAGGCTC GGCCGCCGTG 
GCCAAGGAAG ACCTGGTGCT CCTGGCGGAG CTCCAGGACG AACTGCGCGG GGAAATGCTC 
CTGGCACGCA CCCGTACCTT CCAGCAGCGC CGGGAGGGTC TCGGCACCAG GCTCACCGCC 
ATCACCAAGA ACATCTCCCT CAGCGGGGGA CTGGTGGGGG TCCTCCAGGG CTCCATCGGC 
AATGAGCCCT CCGACCACGT GGACGTGGTC GGCAGGGGAG ACCTGGTCTT CAGTTTCAAG 
GTGGGTGAGA ACACCATCGC GGTGATCGAC GTGGAGGCGA CCGGCGGCAA CGGCATCGAC 
ACCAGGGTGC CCAGCTTCTC GCTGCTGAAC GCCGTGGCCG GCAGCACCGG TGATACGGTC 
CGCTTCCGCG AAGCATGGGT AGAGCATGCG GCGTTCGATG AACGCCTGAT CCTAACCGCC 
GGCAAGATCG ACCTGACCAA CTACTTCGAC GCCAACGGCG TGGCAAACGA CGAGAACAGC 
CAGTTTCTGG CCGGAGCCTT CGTGAACTCG GCGGTTCTGG GTGCCCCCGG CAACGGGCCG 
GGAGCCAGGC TCCAGGCAAA GCTGGGCGAG CCGCTCACCT TCGGCCTCGG CTACGGCAGC 
GGCGACACCG ACACGGAGGA TGTGTTCTCG CACGGCTACG GAATAGCCGA GCTGGACTAC 
ACCCTCAAGG TAGGTGAACT GGAAGGGAAC TACCGCGTCT ATGGCAGCCT GGACGGAGCG 
CGTGCCGATG GCGAGGTGAA GCTGCAGGAA AAAAACGCCT TCGGGTTCGG GATCAGCGCT 
GACCAGCAGG TGACCGACAA GCTGACCCTG TTCGTGCGCT ATGGCCAGCG TGACGAGGAC 
GTCTATGCCA CGAAGATGGC CTGGAGCGCC GGCGGACAGT ACGCCGGGCT GCTTCCCGAG 
CGCAAGGATG ATGTCCTCGG CTTTGCCTAC GGACAGGTGA AGGCCGTGGG TGCTGACTCA 
CAGGAAAAAC TGGCGGAGCT CTACTACAAG GTCCAGGTGA ACGAGCAGAT CAGCATCGCG 
CCTGTGGTTC AGTACCTGAT CAATCCTCTG GGGGACAGCA GCAGGGATGA CGTGGTGGCA 
CTGGGGCTGC GCTCACTGAT CAGTTTTTAA

Protein sequence

MRNMKKVLVV GLALLGSLVV GSTGAQARNP EFALPEKVEV KHKACQEILR LAATYQVEGL 
FSKEFEAGQV CYTRTDLAVV LELLTEKLAE KVVKEGSAAV AKEDLVLLAE LQDELRGEML 
LARTRTFQQR REGLGTRLTA ITKNISLSGG LVGVLQGSIG NEPSDHVDVV GRGDLVFSFK 
VGENTIAVID VEATGGNGID TRVPSFSLLN AVAGSTGDTV RFREAWVEHA AFDERLILTA 
GKIDLTNYFD ANGVANDENS QFLAGAFVNS AVLGAPGNGP GARLQAKLGE PLTFGLGYGS 
GDTDTEDVFS HGYGIAELDY TLKVGELEGN YRVYGSLDGA RADGEVKLQE KNAFGFGISA 
DQQVTDKLTL FVRYGQRDED VYATKMAWSA GGQYAGLLPE RKDDVLGFAY GQVKAVGADS 
QEKLAELYYK VQVNEQISIA PVVQYLINPL GDSSRDDVVA LGLRSLISF