Gene Gura_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_3101
Symbol
ID	5164167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	3666680
End bp	3667816
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	44%
IMG OID	640550589
Product	cysteine desulfurase family protein
Protein accession	YP_001231839
Protein GI	148265133
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01977] cysteine desulfurase family protein

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTATA TCAATAATGC TTCGACTTCT TCACCAAAAC CGGAAGCGGT TTACAAAGCC 
GTTGAACTGT GTATTCGGAC AAGTGGCATG AGTTCGGATA GAAGCTCATT TGTCTCCAAG 
CTGGATTTTA TCCCTAACGA AACGAGGGCA TTGATAGCAA AGCTGATCAA TGCCAGTGAT 
CCTACCCAAA TCGTATTCAC TATGAATGGT ACTGAGGCCT TGAATTTGGC TATCAAAGGT 
ATCTTGAAGC GTGGGGACCA TGTTATCACC ACGAGCCTGG AACATAATTC CGTTATAAGG 
CCTCTTAAGC ACTTGGAACA AGATGGGGAT ATTGAACTCA GCATTGTCCA GGCCAGTTCC 
GAAGGTTTAT TGGATCCCAA TGACATTGTC CCGTTGATCA AAAGTAACAC TAAACTGATA 
GTAACTGCCC ACATAACCAA TGTATTGGGA ACGACGATAC CTATCGAAGA AATCGGCAAA 
ATTGCAGCTC AGCATAACAT AAAATACTTG GTGGACGCGG CTCAAAGTAT AGGTTTTGCC 
GATATCGACG TCGAGAAAAT GAATATAGAT ATGCTCGCAT TCCCCGGCCA TAAGTCCTTA 
TTTGGGCCTT CAGGCACTGG AGGATTGTAT ATAAAGAAAG GCATAGATCT CACACCGATT 
AAGTATGGTG GCACCGGCAA TTTGTCCGAA CCGATTACGC AACCTGATTT CCTGCCTTAT 
AAGTATGAAA GCGGAACCCC CAATACACTG GGTATATGTG GGCTTAATGC CGGGTTGAAA 
TTTGTTGCCA GTGAAGGTGT GGCTAACATA AGAAAGCATG AGCATGAATT GGCTTGCATG 
CTTTACGAGG AATTGTCGAC TATTAAAGGA GTGACACTCT ATGGTCCCAA GAGCCCTGCT 
GAGATAACAT CTATCGTAGC GTTCAATGTC AAAGATAAAA ATCCTATGAA GGTGGCAAAT 
ACGCTGATTA CTAAGTTCGG AATAATCACC AGGCCTGGGT TACACTGTGC CCCTCTGACA 
CATCAAACCG TCGGAACTTG GAAAGATGGT TCGGTCCGGA TCAGCGCCGG GTATTTTAAT 
ACAAAAGAAC ATATTGATGA GGTGGTGAAG GCTGTTGCTG CCATCACTGC TACCTAA

Protein sequence

MLYINNASTS SPKPEAVYKA VELCIRTSGM SSDRSSFVSK LDFIPNETRA LIAKLINASD 
PTQIVFTMNG TEALNLAIKG ILKRGDHVIT TSLEHNSVIR PLKHLEQDGD IELSIVQASS 
EGLLDPNDIV PLIKSNTKLI VTAHITNVLG TTIPIEEIGK IAAQHNIKYL VDAAQSIGFA 
DIDVEKMNID MLAFPGHKSL FGPSGTGGLY IKKGIDLTPI KYGGTGNLSE PITQPDFLPY 
KYESGTPNTL GICGLNAGLK FVASEGVANI RKHEHELACM LYEELSTIKG VTLYGPKSPA 
EITSIVAFNV KDKNPMKVAN TLITKFGIIT RPGLHCAPLT HQTVGTWKDG SVRISAGYFN 
TKEHIDEVVK AVAAITAT