Gene Vapar_3969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3969
Symbol
ID	7974534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	4212836
End bp	4213876
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	66%
IMG OID	644794555
Product	NMT1/THI5 like domain protein
Protein accession	YP_002945849
Protein GI	239816939
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0791999
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACGTC GTCGATTCTT TTTTCTTGCG GCCAGTGCCG CCGCCAGCAC CCTTGTCGCT 
CCCGCCGTCT TCGCCCAGGG CGGCGGCAAG CCGACCCCGC TCAAGTTCAC GCTCGACTTC 
CGCATCAACG GCCAGACCGC GCCCTTCTTC CTCGCGCACA GCAAGGGCTA CTACCGGGAC 
GAAGGCCTGG ACGTGGCCAT CGACACCGGC GCCGGCTCGG TCGCCTCGAT CACGCGCATC 
GCGAGCGGCG TCTACCAGAT GGGCCTGGGC GACATCAGCT CGCTGGTCGA GTTCAATGCG 
CAGAACCCCG GCACCCCGAT GGTGCAGGCG GTGTACCAGT ACTACAACCG CGCACCCTTC 
GTGATCATCG GCCGCAAGGA CCGCGGCGTC ACGGCCGACT TCAAAAGCCT CGCAGGCAAG 
AAGGTGGCCG CGGCGGCCGT CGAATCGACC CGCCGCGCAT GGCCGATGGT GGCGCGCAAG 
CAGGGCATGC GCAGCGACGC CTTCCAGTGG CAGACCACCG ACTTCAGCGC GCGCGACAAC 
GTGATGGTGC GCGGCGACGT CGATGCCGCC ACCTACTTTC ACGACTCTGC CATTTCGCTC 
TTCGCGCGCA TGAAGGCGGA GGAACTGTCG GTGCTCAAAT ATGCGGACGC GGGCGTCAAC 
CTGTACGGCA ACGCCATCCT CGCGAGCAGC AACCTCATTG CGCAGAACCC CAGGGTGGTT 
GCGGCCTTCC TGCGCGCCAC CAACCGCGCC ATCGTCGAGA CCTTTGCCAA TCCGGCGCCC 
AGCATTGCGG CCATGCGCCA GCGCGAACCG ATCCTCGATG AGAAAATGGA GCTTGAACGC 
TGGGGTGTCA CGGCGCAATA TGTCGGTGCC GCCGACACGC GCGGCCACGG CCTCGGCGAC 
ATCCGCAAGC TCACGCTCGA GCAGCAGGTC GACGAGGTCG CCGACGTATT CGGCCTCAAG 
GTCAAGCCCT CGTCCGACGC CATCTTCAAC ACGTCGATGC TGCCATCGCG CAACGAACGC 
ATGATTCCCA CCAAGGCATG A

Protein sequence

MQRRRFFFLA ASAAASTLVA PAVFAQGGGK PTPLKFTLDF RINGQTAPFF LAHSKGYYRD 
EGLDVAIDTG AGSVASITRI ASGVYQMGLG DISSLVEFNA QNPGTPMVQA VYQYYNRAPF 
VIIGRKDRGV TADFKSLAGK KVAAAAVEST RRAWPMVARK QGMRSDAFQW QTTDFSARDN 
VMVRGDVDAA TYFHDSAISL FARMKAEELS VLKYADAGVN LYGNAILASS NLIAQNPRVV 
AAFLRATNRA IVETFANPAP SIAAMRQREP ILDEKMELER WGVTAQYVGA ADTRGHGLGD 
IRKLTLEQQV DEVADVFGLK VKPSSDAIFN TSMLPSRNER MIPTKA