Gene Bpro_4051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_4051
Symbol
ID	4013301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	+
Start bp	4252751
End bp	4253872
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	62%
IMG OID	637943699
Product	twin-arginine translocation pathway signal
Protein accession	YP_550842
Protein GI	91789890
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.222615
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGATA GCAAGACCCC CCGCCGCCGC AGCCTGCTCA AGGGCGCAGC AATGGCCGCC 
GGTGCCGGCG CCATGTCCGC CCCCATGCTG GCGACCGCGC AAACCACCAC CACGCTGCGT 
TTCCAGAGCA CCTGGCCCTC GAAGGACATC TTCCACGAAT ACGCCAACGA CTTTGCCAAG 
AAGGTCAACG ACATGGCTGG CGGCAAGCTG AAAATCGAAG TGCTGCCCGC TGGCGCGGTG 
GTGCCTGCAT TCCAGCTGCT GGAAGCCGTC AACAAGGGCA CGCTGGATGG CGGTCACGGC 
GTGGTGGCCT ACCACTACGG CAAAAACTCG GCGCTGGCGC TCTGGGGTTC CGGTCCCTCC 
TACGGCATGG ACCCCAACAT GCTGCTGGCC TGGCACAACT ACGGCGGCGG CAAGGCCATC 
CTGGAAGAAA TCTACAAGTC GCTCAACATG GACGTGGTGT CCTACCTGTA CGGCCCGATG 
CCGACGCAAC CGCTGGGCTG GTTCAAGAAG CCGGTGACCA AGGTTGAAGA CATGAAGGGC 
CTGAAGTTCC GCACCGTCGG CCTGGCCGTC GACATCTTCA CCGAGATGGG CACCGCCGTC 
AACCCGCTGC CGGGCGGCGA AATCGTGCCG GCGCTGGACC GCGGGCTGAT TGACGCGGCC 
GAGTTCAACA ACGCCTCGAG CGACCGTCTG CTGGGCTTTC CCGACGTGGT GAAAAACTGC 
ATGCTGCAGA GCTTCCACCA GAGCGGCGAG CAGTTCGAGA TCCTGTTCAA CAAGGGCAAG 
TACAACGCCT TGCCACAAGA GCTGCGCTCC ATCATCGACT ACGCCGTCCA GGCAGCCAGC 
GCCGACATGA GCTGGAAGGC TGTGGAGCGC AATTCGCAGG ACTACATCGA ACTCAAGAAA 
GCCGGCGTCA AGTTCTACAA GACACCCGAC GCGATCCTGC GCGCCCAGCT GGCCGCCTGG 
GACAAAACCA TCGACAAGAA AGCCAAGGAA AACGCGCTCT TCAAGAAGGT GCTCGACTCC 
CAGAAAGTCT TTGCGCAGCG CGCGGGCCAG TGGCAGAACG ACTACACCGT GGATTTCAAG 
ATGGCCTATA ACCACTACTT CGGCCGGGGC AAGAAAGCCT GA

Protein sequence

MTDSKTPRRR SLLKGAAMAA GAGAMSAPML ATAQTTTTLR FQSTWPSKDI FHEYANDFAK 
KVNDMAGGKL KIEVLPAGAV VPAFQLLEAV NKGTLDGGHG VVAYHYGKNS ALALWGSGPS 
YGMDPNMLLA WHNYGGGKAI LEEIYKSLNM DVVSYLYGPM PTQPLGWFKK PVTKVEDMKG 
LKFRTVGLAV DIFTEMGTAV NPLPGGEIVP ALDRGLIDAA EFNNASSDRL LGFPDVVKNC 
MLQSFHQSGE QFEILFNKGK YNALPQELRS IIDYAVQAAS ADMSWKAVER NSQDYIELKK 
AGVKFYKTPD AILRAQLAAW DKTIDKKAKE NALFKKVLDS QKVFAQRAGQ WQNDYTVDFK 
MAYNHYFGRG KKA