Gene Rmet_5038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_5038
Symbol
ID	4041900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	-
Start bp	1724189
End bp	1725235
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	67%
IMG OID	637980459
Product	extra-cytoplasmic solute receptor
Protein accession	YP_587169
Protein GI	94313960
COG category	[S] Function unknown
COG ID	[COG3181] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.610861
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTTCC CTTGTTTCTC CTCGCGCCGG CAAACCACGC CGGCCGCTTC TGGCGGGATG 
CCGCGCGCGC AACGCGGCAG GCTTGCCGTC ATCGCCGCGC TGTCCGCGCT GTGTCTGCCC 
GGCGGCATGT TGCCGACTTC CGCCTGGGCG GATAGTGGAA CGCCATTGAA GCTCGTCGTC 
ACCTTCCCGC CCGGGGGCAG CACGGATATC GCCGCGCGCA TCGTGCAGCC CAAGTTGGCG 
GAGGTGTTAG GGCGTCCCGT GGTGGTGGAG AACCGTCCCG GCGCCGCGAG TCAGGTCGCG 
ACGCAGTACG TGGCGCGCTC CGCGCCGGAC GGCAACACCT TGCTGATCAG CTTCGATACC 
CATGCGATCA ATCCCATCGC GAAATCCCGG CTGCCGTATG ACACCTTCAA GGATTTCTCC 
GGTGTCACGC TGGCGCTGCG TTTCCCACTG GTGATCGGTG CCCATCCGTC GGTGCCCGGC 
AAGGACCTGC GCGGATTCCT GGATGCCGCG CGGCGCGCGC CCAATCAGTA CAGCTACGCG 
TCCACCGGTC TTGGTTCGAT GAACCATCTC GTCGCGGAGG ACTTGAAGCG TCAGGCCGGG 
GTGGAACTGC TGCACGTGCC TTACGCCGGC GGGGGGCCGG CTGTGCAGGC CGTGCTGGGG 
AACGTGTCGA GCCTGACGCT GCTGAGCTAC GCCGCGCTCA AGGGCCAGAT CGCTGCGGGG 
CGCATCAAGC CCCTCGCTGT GACCGGCGCC AACCGACTGC CTGATCTGCC CGATGTGCCG 
ACGGTGGCGG AGTCCGGATT CCCGGGCTTC GAGGCGTACT CGTGGATTGG CGTGTTCGCG 
CCGTCCGGCA CGCCACCGGC CGTGGCGCGC AAGCTGACCA GCGACTTCCA GGCCGCCCTT 
AATGATCCGG AGACCCACCG CAAGCTGACG CAGGCAGGGT TCGAGGTGAT GGCCACCGAT 
GGTCCGGCGC TCGATCGTTA CGCTCGCGAG CAGTATGAAC GCTGGAAAGC CTTCGTCGTG 
AAGACCGGGC TGAAGCTGGA GGAGTAG

Protein sequence

MLFPCFSSRR QTTPAASGGM PRAQRGRLAV IAALSALCLP GGMLPTSAWA DSGTPLKLVV 
TFPPGGSTDI AARIVQPKLA EVLGRPVVVE NRPGAASQVA TQYVARSAPD GNTLLISFDT 
HAINPIAKSR LPYDTFKDFS GVTLALRFPL VIGAHPSVPG KDLRGFLDAA RRAPNQYSYA 
STGLGSMNHL VAEDLKRQAG VELLHVPYAG GGPAVQAVLG NVSSLTLLSY AALKGQIAAG 
RIKPLAVTGA NRLPDLPDVP TVAESGFPGF EAYSWIGVFA PSGTPPAVAR KLTSDFQAAL 
NDPETHRKLT QAGFEVMATD GPALDRYARE QYERWKAFVV KTGLKLEE