Gene Dbac_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dbac_1954
Symbol
ID	8377627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfomicrobium baculatum DSM 4028
Kingdom	Bacteria
Replicon accession	NC_013173
Strand	-
Start bp	2249280
End bp	2250293
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	58%
IMG OID	645001179
Product	ApbE family lipoprotein
Protein accession	YP_003158458
Protein GI	256829730
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.355281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCATG GGACCCACAC TCAAGACCGC CGTGATTTTC TGAAAAAACT GGCTGTGCTC 
GCCGGTGGAG CAGCACTGGC TCCTGCGTTG CGCGTGCTTC CGGCCATGGC TGCGAGCGGC 
TTGGTCATGA CCACCGAAAA GCGCATGCTC ATGGGAACGA TTGTCGGCAT GACCGTCATG 
GCCCCAAGTA AGAATCAGGG TCAAGAAGCC ATTGGCCGCG CTTTTGATGA AATGAATCGT 
TTGATCGGCA TTTTGAGCCG ATTTGATTCC AATACCGCCT TGTCCGCCCT GAATGTTCAC 
GGACGCCTTT CCGGATCTCC GCGGGAACTG CTGGACGTCC TGGCTCACGG AAGCACGCTG 
CACCGTCAAT CCGGTGGACG CTTCGACATG ACTGTGGCAC CTGTTGTCAA CCTCATGGAA 
CGCACCAAGG GGCAGCCTGA CGCAAAGGAA CTTCAAGAGG CCCTGGCTCT GGTTGATTCC 
ACCCAAGTGC GGCAGAGCGG ATCGGATTTG AAGTTCACCA CATCCGGGAT GAGCGCGACT 
CTTGACGGAA TAGCCAAAGG ATACATTGCC GACAAAGCGG CAGAAATGCT GGGCGCGCTC 
GGAGTTGCTC ATTACATGGT CGATGCCGGC GGAGACATTC GCGTCCAGGG CTCGCCCAAA 
GGTGACGGTC GTCCGTGGCG CATTGCCATC GAAGATCCAA ACAAGCAGGG CGATTATCCT 
GCCGTCATCG AAATGCGTTC GGGCGCCGTG GCAACATCCG GCGGTTATGA AGTCTTTTTT 
GATTCTTCCC GCAAATCGAC TCACCTGATC AACCCCGAGA CCGGCGCTTC CCCGCAGTAC 
ATCAGAAGCG TGAGCGTCCA GGCTCCCACG GTTATGCAGG CTGACGGCCT GGCCACGTCG 
CTGAGTCTCA TGTCACCGCG CGAGGCTTTG CGTCTGACCT CATCGCTGCC CGGTCATTCC 
TGTCTGCTGG TGACCTCCTC CGGTGCGCGC CTTGCTTCTC CTTTATGGAG CTAA

Protein sequence

MKHGTHTQDR RDFLKKLAVL AGGAALAPAL RVLPAMAASG LVMTTEKRML MGTIVGMTVM 
APSKNQGQEA IGRAFDEMNR LIGILSRFDS NTALSALNVH GRLSGSPREL LDVLAHGSTL 
HRQSGGRFDM TVAPVVNLME RTKGQPDAKE LQEALALVDS TQVRQSGSDL KFTTSGMSAT 
LDGIAKGYIA DKAAEMLGAL GVAHYMVDAG GDIRVQGSPK GDGRPWRIAI EDPNKQGDYP 
AVIEMRSGAV ATSGGYEVFF DSSRKSTHLI NPETGASPQY IRSVSVQAPT VMQADGLATS 
LSLMSPREAL RLTSSLPGHS CLLVTSSGAR LASPLWS