Gene Pden_3856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pden_3856
Symbol
ID	4582407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Paracoccus denitrificans PD1222
Kingdom	Bacteria
Replicon accession	NC_008687
Strand	+
Start bp	988892
End bp	989887
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	65%
IMG OID	639771165
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_917618
Protein GI	119386563
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.215076
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAAAT TTCTTGCTTC GACTACGCTT GCCTTCATGG CACTGGCCGT CCCCGCATTC 
GCCGCTGACG AGGAATGCGG CAGCATCACC GTGGCAGAGA TGAACTGGGC CTCGGCGGGG 
CTGGCGGCGT GGGTCGACAA GATCATCCTC GAAGAGGGCT ATGGCTGCGA CGTGGCGCTG 
GTCTCGGGCG ATACGATGCC GACTTTCGCG TCGATGAACG AAAAGGCCCA GCCGGACATG 
GCCCCCGAGT TGTGGGTCAA CGCGGTCAAG GAGCCGCTGG ACCAGGCGGT CGCGGAAGGG 
CGGATCGTGA TCGCCTCGCA GATCCTGTCC GATGGCGGGG TCGAGGGCAT CTGGGTGCCG 
ACATGGCTGG CCGAAGAGCA CAACATCCAC ACGCTCAAGG ACGCGCTGGA ACATCCAGAA 
CTGTTCCCCG GCGCCGAGGA CAGCAGCAAG GGCGCCTGGT TCGGCTGTCC CTCGGGCTGG 
GCCTGCCAGG CGATCAACCG CAACCAGTTC GTCGGCTCGG GCGCTGCGGA CAAAGGGTTC 
GAACTGGTCG ATTCCGGCTC GGCCGCCGCG CTGGACGGCT CGATCGCGCG GGCGGCGAAC 
CGCAAGGAGG GCTGGCTGGG CTATTACTGG GCACCCACTG CCATCTTGGG CCAGTATGAC 
ATGACCCGGC TGGAACTCGA GGCCGAATTC GACCGCGAGC GCTGGGACAA TTGCATGGTC 
AAGCCCGACT GCGTCGATCC GCAGGTGACG GAATGGCCGG TCTCGGACGT CTATACCGCC 
GTGACCAAGG AGTTCGCCGA CAAGGCCGGC GTGGCCATGG ATTACGTCAA GACCCGGGCC 
TGGAGCAACG AGACCGTCAA CGCCATGCTG GCCTGGATGG TCAAGAACCA GGCCAGCAAC 
GAGGATGCCG CCTATGAGTT CCTCGAACGG CACGAGGACA TCTGGACCGA ATGGGTTCCC 
GCCGAAGTGG CCGACAAGGT CAGGGCCGCC CTTTAA

Protein sequence

MGKFLASTTL AFMALAVPAF AADEECGSIT VAEMNWASAG LAAWVDKIIL EEGYGCDVAL 
VSGDTMPTFA SMNEKAQPDM APELWVNAVK EPLDQAVAEG RIVIASQILS DGGVEGIWVP 
TWLAEEHNIH TLKDALEHPE LFPGAEDSSK GAWFGCPSGW ACQAINRNQF VGSGAADKGF 
ELVDSGSAAA LDGSIARAAN RKEGWLGYYW APTAILGQYD MTRLELEAEF DRERWDNCMV 
KPDCVDPQVT EWPVSDVYTA VTKEFADKAG VAMDYVKTRA WSNETVNAML AWMVKNQASN 
EDAAYEFLER HEDIWTEWVP AEVADKVRAA L