Gene Pden_1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_1899
Symbol
ID	4581119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008686
Strand	+
Start bp	1898812
End bp	1899765
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	66%
IMG OID	639769219
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_915690
Protein GI	119384634
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.526364
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTTTC GTCGCACCAC CGCCGCTCTT GCCGCCGGGC TGGTCGCCTC GCTCGCCACG 
GCTGGCATCG CTGCGGCAGA AGAGCCGATG GAGTGCCGCA AGGTCGTCTT CTCGGATGTC 
GGCTGGAGCG ATATCAGCGC CACCACGGCG CTGGCCTCGA CCGTGCTCCA GGCCCTCGGC 
TACCAGACCG AGACCAAGAT CCTGTCGGTG CCGGTGACCT ATACCGCCAT GTCGACCGAC 
GACGTGGACG TGTTCCTGGG CAACTGGATG CCGACGATGG AGGCCGATAT CGCCCCCTAT 
CGCGAGGCGG GCACGGTCGA GATCGTGCGC ACGAACCTGA CCGGGGCGAA ATACACGCTG 
GCGACGAACC AGGCCGGCGC CGATCTGGGC ATCGACGATT TCGGCAAGAT CGCCCAGCAC 
AAGGACGCGC TGGCCGGCAA GATCTACGGC ATCGAGCCGG GCAATGACGG CAACCGCCTG 
CTGCTGGACA TGGTGGCCGA CAACAAGTTC GACCTAGGCA CCTTCGAGGT CGTCGAAAGC 
AGCGAACAGG GCATGCTGGC GCAGGTCGCC CGTGCCGACG CCGCCGGCAA GCCGGTGATC 
TTCCTGGGCT GGGAGCCGCA TCCGATGAAC AGCCAGTTCC AGATGACCTA CCTGTCCGGC 
GGCGACGAGG TCTTCGGCCC CGACTTCGGC GGCGCGCGGG TCGATACCAA CACCCGCGCC 
GGCTATGTCG AGGCCTGCCC GAACGTCGGC AAGTTCCTGC AGAACCTGGA ATTCACCCTG 
CCCATGGAGA ACGAGGTCAT GGGCCTGATC CTGAACGACG GCGAGCAGCC CGCCGATGCG 
GCGCTGAAAT GGCTGAAGGC CAACCCGGAC GCGGCAAAAC CCTGGATCGC GGGCGTGACC 
GCTGCCGATG GCGGCGATGC GCAGGCGGCC CTGGACACGG TGCTGTCCAA GTGA

Protein sequence

MTFRRTTAAL AAGLVASLAT AGIAAAEEPM ECRKVVFSDV GWSDISATTA LASTVLQALG 
YQTETKILSV PVTYTAMSTD DVDVFLGNWM PTMEADIAPY REAGTVEIVR TNLTGAKYTL 
ATNQAGADLG IDDFGKIAQH KDALAGKIYG IEPGNDGNRL LLDMVADNKF DLGTFEVVES 
SEQGMLAQVA RADAAGKPVI FLGWEPHPMN SQFQMTYLSG GDEVFGPDFG GARVDTNTRA 
GYVEACPNVG KFLQNLEFTL PMENEVMGLI LNDGEQPADA ALKWLKANPD AAKPWIAGVT 
AADGGDAQAA LDTVLSK