Gene Dtpsy_1063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_1063
Symbol
ID	7382872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	+
Start bp	1105507
End bp	1106595
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	70%
IMG OID	643654378
Product	ApbE family lipoprotein
Protein accession	YP_002552540
Protein GI	222110276
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCAG ATCGGTGCAT GCCGGCGGTA GGCAACCGGT GGACGCGGCG GCGCTTCGCC 
CTTGCGCTGC CGTTGCTGGG CGCGCTGGCG TACCTCCACC CGCGCCAGGC TTTGGCTGGC 
ATGGTGGAGG GCGCGCAGCC CCTGGTGCGC GCGAGCCGTA CCCTCATGGG CACACGCGTG 
GACATCGCGG CTGCCGTTGG CAATGGCCGC GATGCCGGCG CTGTGCAGCA GGCGATGCTG 
CACGCATTCG CGGAAATGGA GCGCCTGGAG GCGCTCATGA GCCGTTACCG GGAGGGCAGC 
GACGTGGCGC GGCTCGGCGC GGCCGCCGGC CGGCATGCCG TGCACGTGGC CCCGGAAGTG 
ATGCAGGTGC TGCGCACGGC GCGTCGCCTG CACCAAGAAA GTGCTGGCGC CTTTGATCCC 
ACCGTCGGTG CACTGCGGGG CTGGCATTTT GAGCCCGGCC ACGAAGCCGC GCCGGCACCT 
GAGGAGATCG CTCAGGCGCT GCGTTTGGTG AACGCGCGCC ACCTCGTGCT GGACGAGCGC 
GCAGGAACGG CCTACCTTGC GCGGCCGGGC ATGGGGTTGG ATCTGGGCGG CGTGGCGAAG 
CTACCTATTT TGCAGGCGGG CTTGCAAGTG CTGGAGCGCG CTGGCGTCAC GGATGCGCTG 
GCCAACGGCG GTGGCGATGT CCTGGTCATG GGCCGGCAGC ACGACCGTCC CTGGCGTGTG 
GGCGTGCGCA ATCCCTCCGC TCCGGCGCAG CTGCTGGGCG TACTGGAACT GCAAGGGCGC 
GGCGTGGTGG CATCGTCCGG CGACTACGAG CGGGGCTTCC TGCGTGCAGG ACGCCGCCTG 
CACCATGTGC TCAACCCCCG CACGGGTTGG CCTACGGAAG GTGTGTCTGG CGTGGCGCTC 
ATGGCCGAGC GTGTTGAAGA CGTCAACGGC TGGGGCACGG CGCTGATGGT GCAAGGGGCT 
GCGGCCGCAC CTGCATGGCA TGCGGACCAC GCACATGTCG AAGCCCTCGT GGCGAGCGCT 
GATGGCACGC CCTGGAGTTC CCCTGGAATG CTCGCCGCGC TGCGGCCAGT GCCGGCGCGC 
GCAGGATGA

Protein sequence

MNSDRCMPAV GNRWTRRRFA LALPLLGALA YLHPRQALAG MVEGAQPLVR ASRTLMGTRV 
DIAAAVGNGR DAGAVQQAML HAFAEMERLE ALMSRYREGS DVARLGAAAG RHAVHVAPEV 
MQVLRTARRL HQESAGAFDP TVGALRGWHF EPGHEAAPAP EEIAQALRLV NARHLVLDER 
AGTAYLARPG MGLDLGGVAK LPILQAGLQV LERAGVTDAL ANGGGDVLVM GRQHDRPWRV 
GVRNPSAPAQ LLGVLELQGR GVVASSGDYE RGFLRAGRRL HHVLNPRTGW PTEGVSGVAL 
MAERVEDVNG WGTALMVQGA AAAPAWHADH AHVEALVASA DGTPWSSPGM LAALRPVPAR 
AG