Gene Gura_3214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_3214
Symbol
ID	5167039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	3776727
End bp	3777767
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	57%
IMG OID	640550699
Product	lipopolysaccharide heptosyltransferase I
Protein accession	YP_001231948
Protein GI	148265242
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02193] lipopolysaccharide heptosyltransferase I

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGGTCC TGATCGTTAA AATGAGCGCC ATGGGTGATA TAATCCATGC CTTGCCGGTA 
TTGGATTACC TGCACAAGGT TTCACCGGGG ATCGAGATCG ACTGGCTGGT CGAGGAGCCT 
TTCCTGGACG TTGTGGCCGG AAATCCGCTG ATCAGCACGA TCCATACGGC ACGCACCAAG 
GTCTGGCGCA AGCGGCCTTT CGCCGTCAGT ACATTTCGTG AGATCGGCGC ATTGAAGCAG 
GCGTTGCAGG AGAGGGCATT CGATGTCGTT TTCGATATCC AGGGGAACAT CAAGAGCGGC 
GTCTTCGGCT GGCTGAGCGG TGTCGACAAC CGGATCGGCT TCAATGCCGA CGTCCTCCAG 
GAACGGCTGA ACATGATGTT CACGACGCGC CAGATACCGT TGCGGCCCCA TGATTACCAT 
ATCACCGACC AGTACCTGCG GCTTGTCAGC GTCCCCTTCG GTCGCGATTT CAGGAAAATG 
CAGCTTTCAT CCGACATTTA CACGACGCCG GAGGACGACG CTGTCGCCGA GACACTTCTC 
TCCACCCTGG CCGACGGGCT GGTATTCCTG TTCCATTACG GGACCACCTG GCAGACCAAG 
TTCTGGAGCG AGAAGAGTTG GATCGAGCTG GGGAAGGCTT TGCTGGATAG GTTTTCGGAA 
TCGTCAATCC TCCTTTCCTG GGGTAATGAT ACGGAGCGCC GTGTAGTAAT GGGTATTGCC 
GCGGGTATCG GGCCCGGCGC CAGGGTGATT GAACGGTATT CGTTGAAAGG CTTGACCGCC 
CTGCTGAAGA AGGTCGATCT GGTGGTGGGA GGTGACACGG GCCCTGTGCA TCTGGCCGCA 
GCGGTCGGCA CGTCGACCGT TTCCTTTTAC CGCTCTTCCG ACGGCAAAAG GAGCGGTCCG 
CGAGGCGATG GTCATGTGAT TGTCCAGTCC CCACTGCTGT GCGCCAGGTG TTTCAGGACA 
CGATGTGACA AGGATGAGGA ATGCCGGCAA AGCATAACGG TGGAAGCCGT TGTATGTGGT 
GTTGAAAAAC TTTTAACCTA G

Protein sequence

MRVLIVKMSA MGDIIHALPV LDYLHKVSPG IEIDWLVEEP FLDVVAGNPL ISTIHTARTK 
VWRKRPFAVS TFREIGALKQ ALQERAFDVV FDIQGNIKSG VFGWLSGVDN RIGFNADVLQ 
ERLNMMFTTR QIPLRPHDYH ITDQYLRLVS VPFGRDFRKM QLSSDIYTTP EDDAVAETLL 
STLADGLVFL FHYGTTWQTK FWSEKSWIEL GKALLDRFSE SSILLSWGND TERRVVMGIA 
AGIGPGARVI ERYSLKGLTA LLKKVDLVVG GDTGPVHLAA AVGTSTVSFY RSSDGKRSGP 
RGDGHVIVQS PLLCARCFRT RCDKDEECRQ SITVEAVVCG VEKLLT