Gene Rpic_1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpic_1042
Symbol
ID	6289579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia pickettii 12J
Kingdom	Bacteria
Replicon accession	NC_010682
Strand	+
Start bp	1108315
End bp	1109364
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	63%
IMG OID	642624614
Product	NMT1/THI5 like domain protein
Protein accession	YP_001898622
Protein GI	187928135
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.778479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGACAC AAGTCATCGG GCGCTGGGCA AAGTGGATGG GCGCTGCACT GTGTGCGACG 
AGCCTGCTGG CTGCCAGTCC AGCCGTTCTG GCGCAGGGCA AACCTGAAAA GAGCAAGGTC 
ACCATCGCGG TGGGCGGCAA GGCGTTGTTC TACTACCTGC CGCTGACGAT TGCAGAGCGT 
CTGGGTTACT TCAAGGACGA AGGCCTGGAC GTTGAAATCG TCGACTTTGC TGGCGGCGCA 
AAAGCCCTGC AGGCCGTGGT GGGCGGTAGC GCCGACGTGG TGAGCGGCGC GTACGAGCAC 
ACGCTGGTGC TGCAGGCCAA GGGGCAGATG TACCAGGAGT TCGTGCTGCA AGGGCGGGCC 
CCGCAGATCG TGCTGGCGGT CAACAACAAG ACGGTGCCCA ACTACAAGTC GATTGCCGAT 
TTGAAAGGCA AGAAGATCGG CGTGACGGCT CCCGGTTCGT CGACCAACAT CATGGTCAAC 
TATGTGCTGG CGCGCGCCGG CATCAAGCCG AACGAAGTGT CGATCATCGG CGTGGGTCCG 
AGCAGCGGGG CGATTGCCGC CGTGCGTGCT GGGCAGATCG ATGCCCTGGC CAACCTGGAC 
CCGGTGATGT CGATGCTCAC GCAAAAGAAC GAAGTGCGCG TCGTGTCCGA TACCCGCACC 
CTGGCCGATA CCAAGGCGGT GTTCGGTGGC AACATGCCGG CCGGCTGCCT GTACGCGTCT 
ACCGCGTTCA TCCAGAAGAA TCCCAACACG ACGCAGGCGA TGACCAACGC CATGGTGCGT 
GCGCTCAAGT GGCTGCAAAA GGCGGGCCCG TCGGACATCG TCAAGACGGT GCCCGAAGCC 
TATCTTTTGG GCGACCGTGC GCTGTATCTG GCGGCGTGGG AGAAGGTGCG TGAGGCCATC 
TCGCCGGATG GCACGATGCC GGCCGACGGC CCGGCTACGG CGCTGCGCAC GCTGTCGGAG 
TTCGATGCGG AAGTGAAGGG CAAGCAGATC AAGCTCGACC AGACCTTCAC CAATACCTTC 
GTGCAGAAGG CCAACGCCAA GTACAAGTAA

Protein sequence

MGTQVIGRWA KWMGAALCAT SLLAASPAVL AQGKPEKSKV TIAVGGKALF YYLPLTIAER 
LGYFKDEGLD VEIVDFAGGA KALQAVVGGS ADVVSGAYEH TLVLQAKGQM YQEFVLQGRA 
PQIVLAVNNK TVPNYKSIAD LKGKKIGVTA PGSSTNIMVN YVLARAGIKP NEVSIIGVGP 
SSGAIAAVRA GQIDALANLD PVMSMLTQKN EVRVVSDTRT LADTKAVFGG NMPAGCLYAS 
TAFIQKNPNT TQAMTNAMVR ALKWLQKAGP SDIVKTVPEA YLLGDRALYL AAWEKVREAI 
SPDGTMPADG PATALRTLSE FDAEVKGKQI KLDQTFTNTF VQKANAKYK