Gene Rmet_4720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_4720
Symbol
ID	4041581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	+
Start bp	1362535
End bp	1363635
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	63%
IMG OID	637980141
Product	hypothetical protein
Protein accession	YP_586851
Protein GI	94313642
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACAA CGATCACGAC GGTCGGGCTC AAGCGCCTCG CCGTTGCCAC GCTATTCGCC 
TGCGGGATAG TCCATGCGCA ATCGACGGTG CCGGTGATGC AACCCACCGA AGGCGATTTC 
GAAGCACGCG ACTTCCACTT CCAGAGCGGC CAGACGCTGC CGACCGTCAA GCTTCACTAC 
GCGACACTGG GCACGCCCAC TCGCGGCGCC GACGGCAAGG TCAACAACGC CGTGCTTCTG 
CTCCACGGCA CTACCGGCAC CGGACGCGCG TACCTGACGC CGCTGATGCA GAAGGAACTG 
TTCGCGGCGG GACAGCCGCT CGACGCCTCG CGTTACTACA TCATCATGCC CGACGGCATC 
GGCCGTGGCG GATCGAGCAA GCCCAGCGAC GCCCTGCGCG CGAACTTTCC GCGCTATGGC 
TACAACGATG TGGTGGAAGG CCACTACCGC CTGCTGACCG AGGGACTCAA AGTCGATCAC 
CTGCGGTTGA TACTGGGCAC GTCGATGGGC GGCATGCAGA CGTGGGTCTG GGGTGAACGG 
CATCCGGACA TGATGGATGC GCTGATGCCG ATCGCCAGCC AGCCCGTGGC GATGTCGGGC 
CGCAACTGGT TGTGGCGCCG GATGCTGATC GACGCGATCC GGAATGACCC GGACTGGAAC 
GGCGGCAACT ACACGCGGCA GCCCACGCAC TGGACCCGCA CCACGCCGGT ATTCGCCCTG 
ATGACGCAAA GCGCGGCCAC GTTGCAGAAG GCCGCTCCTA CGCGCGACCA GGTCAACCAG 
TACGTCGACA AGACCGTGGC GGACAGCCGC GGCGTGGACG CCAATGACTA CCTGTACTGG 
TTCGAATCAT CATGGGACTA CAACCCCGAG CCGGATCTGG GCATGATCCG CGCGCCGCTT 
TACGCGGTGA ACTTCGCCGA CGACATGATC AACGCGGTGG ACCTCGGCGT CATGCAACGC 
ACCGTGCCGA AGGTACGGCA AGGCAAGTAC GTGGAGATGC CGGAGAGCGT GAACACATAT 
GGCCATCAGA CGTTGCAACA CCCCGAGGTC TGGAAGCCGT ATCTCGTTGA ACTGCTGAAG 
TCGCTACCCG CGCAAAAGTA G

Protein sequence

MKTTITTVGL KRLAVATLFA CGIVHAQSTV PVMQPTEGDF EARDFHFQSG QTLPTVKLHY 
ATLGTPTRGA DGKVNNAVLL LHGTTGTGRA YLTPLMQKEL FAAGQPLDAS RYYIIMPDGI 
GRGGSSKPSD ALRANFPRYG YNDVVEGHYR LLTEGLKVDH LRLILGTSMG GMQTWVWGER 
HPDMMDALMP IASQPVAMSG RNWLWRRMLI DAIRNDPDWN GGNYTRQPTH WTRTTPVFAL 
MTQSAATLQK AAPTRDQVNQ YVDKTVADSR GVDANDYLYW FESSWDYNPE PDLGMIRAPL 
YAVNFADDMI NAVDLGVMQR TVPKVRQGKY VEMPESVNTY GHQTLQHPEV WKPYLVELLK 
SLPAQK