Gene Bpro_3371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_3371
Symbol
ID	4013946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	+
Start bp	3564726
End bp	3565751
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	70%
IMG OID	637943035
Product	twin-arginine translocation pathway signal
Protein accession	YP_550179
Protein GI	91789227
COG category	[S] Function unknown
COG ID	[COG3181] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACTC GTCACCCAAC AACCCTCGCA GCCGGGGGCT GCCTCTCGCG CCGTGGCCTG 
CTCGTGCAGG CGGCAGCTGC CGCGCTGGCG GCGCCCTGGG TGGCCAACAG CCATGCGGCG 
GCCAATGTGG CGGGCGGCCG GCCCATCACG CTGGTGGTCT CGTACCCCGC AGGCGGCGGC 
GCAGACCTGA TTGCGCGCAT CATCGCGCCG CGCATGGCCG ATGCGCTGGG CCAGAGCGTG 
GTCGTGGACA ACAAACCCGG CGCGAGCGGG CAGCTGGCGG CATCACAGGT AGCGCGCGCC 
ACGGCGGACG GCACCACGCT GCTGCTGGAT GCATCGTCCT TCGCGGTGAA CCCGTCGCTG 
TTTCCCAAGC TGCCGTACGA CAGCGCCAAG GCCTTCACGC CGCTGGCGGT GCTGGCCACC 
TTTCCGAACG TGCTGGTGTG CACGCCCGGC TTTTCTGCCA GGTCGGTCAA GGACGTGATC 
CAGCTGGCCA GGGCCCGGCC GGGCGAGGTG ACATATGCCT CGTCGGGAAA CGGCTCGGCG 
CAACACCTGG CGGGCGCCAT GTTCGAAGGC CGCGCAGGCG TGCAGCTGCT GCACATTCCC 
TACCGTGGCG GCGGCCCGGC CCTCAATGAC GTGATGGGCG GACAGGTGCC GCTGTTCTTC 
GCCAACGTGG CGTCGTCGCT GGGGCATATC CAGGCGGGCA AGCTGCGGCC GCTGGCGGTG 
ACCAGCGCGG TGCGAGCCCG CTCGCTGCCC GATGTGCCCA CCATGGCGGA GGCCGGATTG 
GCCGGCTTCG AGGTGCTGGA GTGGAACCCG CTGCTGGCCC CTGCAGGCCT GCCGGCGGAC 
GCAAAGGCCA CGCTGGTGGC CGCCATTCGC AAGGCACTGG CCGACCCCGA GGTGCTGGGC 
CGCGTGCGCC AATTGGGCGG TGACGTGTTT GCCGATACCT CGCAGCAAAG CGCCGGCAAG 
TTCATCGCGG CCCAGCAGGA ACAATGGGCG CGTGTGGTGC GCGAGCGCAA GATCTCGGTG 
GGCTGA

Protein sequence

MNTRHPTTLA AGGCLSRRGL LVQAAAAALA APWVANSHAA ANVAGGRPIT LVVSYPAGGG 
ADLIARIIAP RMADALGQSV VVDNKPGASG QLAASQVARA TADGTTLLLD ASSFAVNPSL 
FPKLPYDSAK AFTPLAVLAT FPNVLVCTPG FSARSVKDVI QLARARPGEV TYASSGNGSA 
QHLAGAMFEG RAGVQLLHIP YRGGGPALND VMGGQVPLFF ANVASSLGHI QAGKLRPLAV 
TSAVRARSLP DVPTMAEAGL AGFEVLEWNP LLAPAGLPAD AKATLVAAIR KALADPEVLG 
RVRQLGGDVF ADTSQQSAGK FIAAQQEQWA RVVRERKISV G