Gene GSU3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3020
Symbol
ID	2686810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	3314633
End bp	3315748
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	49%
IMG OID	637127713
Product	hexapeptide transferase family protein
Protein accession	NP_954062
Protein GI	39998111
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1044] UDP-3-O-[3-hydroxymyristoyl] glucosamine N-acyltransferase
TIGRFAM ID	[TIGR03570] sugar O-acyltransferase, sialic acid O-acetyltransferase NeuD family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAAAA CAATGGACAT AATCATTCCC AGAGAATTTG TCAGCGACGA CCAGTACCTG 
CTCCAGAAAC TCTGTGTCGT GAACAATGAC TTTGTAAAAG AAGGAGAGAT ACTTGCCCTG 
ATCGAATCAT CAAAATCTGT CATTGACGTT ACGAGTCCGG CTGATGGCTA TGTCTATTTT 
TTCTCTGACG AAGGAGACAT TGTGAGTGTC GGCGAGAGGT TGGCCTTGCT CGCATCAACC 
AAGGAGGCAT TACAGGTTGA AATAGAGAAT TCCAACAAGA ACTCTCAGCG TCGCAAGGAG 
AGTGAGACAA AGAGCGAGGA CGTTTCATTG TCTGGCGTGA GGTGCTCCAA GAAGGCATTG 
CTTCTGATGA AACAGCACAA TATCGATGTA GGAGCATTTG ATGGTCTCGG GATGGTTACG 
GCGCAGGACG TAGAGCACTA TCTCTCCAGC AGGGAAAAAG CCGTTAAAGC GACAGTAGCT 
CCATCTTCCG TAAATAGGCA GAAAATCATC ATCCTTGGTG GCGGAGGACA TTCAAAAGTA 
TGCATAGACA TACTGCGCCA GGCACAATCT TTCACAATCG CAGGAATTCT CGACTCTATC 
CAGGACATTG GCGCAGAAGT GCTGGGAATC CCGGTCATTG GAAGAGACAC AATGCCGGAA 
CTACTCAAGA CCAGAGAGAG TGGCATCTCC CTTGCGGTTA ACGGGATTGG ACTCATTCCG 
GATCACCGGA ACAGATGCAA GCTTTTTGAG AGGCTATTGG AGGCCGGCTT TCATCTCCCT 
AACCTCATAC ACCCCAAGGC ATCAATCGAA CCTTCGGCAA AACTCGGCGA AGGGAACCAG 
ATCATGGCAG GAGCCATTAT CGGGAGCGAT GTCACAGTAG GAAACTACTG TCTCATAAAC 
TCGGGAGTCG TCGTCTCGCA CGACTGTATC ATCGACGACC ACGTCCACCT GGCCCCCGGT 
GCGCTGCTTG CAGGAGCAGT CAGAGTTGGA AGAAACTCTT TGATCGGCAT GGGCGTTACA 
ATCTACGCAA AAGTAACAAT AGGAAGCAAC GTAGTTATAG CCAACGGCGC CAACGTGTTT 
CACGATGTGC CGGACAACAC CGTCGTCAAG ATTTGA

Protein sequence

MMKTMDIIIP REFVSDDQYL LQKLCVVNND FVKEGEILAL IESSKSVIDV TSPADGYVYF 
FSDEGDIVSV GERLALLAST KEALQVEIEN SNKNSQRRKE SETKSEDVSL SGVRCSKKAL 
LLMKQHNIDV GAFDGLGMVT AQDVEHYLSS REKAVKATVA PSSVNRQKII ILGGGGHSKV 
CIDILRQAQS FTIAGILDSI QDIGAEVLGI PVIGRDTMPE LLKTRESGIS LAVNGIGLIP 
DHRNRCKLFE RLLEAGFHLP NLIHPKASIE PSAKLGEGNQ IMAGAIIGSD VTVGNYCLIN 
SGVVVSHDCI IDDHVHLAPG ALLAGAVRVG RNSLIGMGVT IYAKVTIGSN VVIANGANVF 
HDVPDNTVVK I