Gene BURPS1710b_A1191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1191
Symbol	rhsA2
ID	3692071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	1494515
End bp	1495792
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	62%
IMG OID	637731445
Product	YD repeat-containing protein
Protein accession	YP_336348
Protein GI	76819503
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3209] Rhs family protein
TIGRFAM ID	[TIGR01643] YD repeat (two copies)

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.270395
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGGCGTG CGAGCGCGAT GATCGATCCG GCGGGGCGGA CGACGGCTTG GGAATATGAC 
GCGTATGGCA GTTTGCTTGT GCAGACGTTG CCGGATGGCA GCGCAGTCAG AACGGAATTT 
GACCTCGATC ACCGACCGGT CTGCATGACG TTGATAGGCG GCCGGCAGTG GGGCTACGAG 
TGGAATACGT TCGGTAATCT GCTCGCGCAG AGCGATCCAT CGGGGGCGAT ATCTCGCTAT 
ACCTATGACG AGTACGGCCA GCTTGTTGAG CATACTGGGC CGCGTGGTGC GAGCACACGG 
TTCGATTATC ACCCGGACGG CAATCTCGCG GCGCAGATCG ATGCGTTGGG GCATCGCACG 
CAGTATCGGT ACGATGCGCG CGGCTACCTC GGCGAAGCAA TCGATGCGCT CGGACAGCAA 
AGCCAATACG AGTACGACCG CAACGGCCAT CTGACGCGCG CAATCGAGCC GGGCGGGCGT 
GAGATTCACT GTGCGTACGA CGCCGATGGA AATCTGTCTC GCCATCGTGA CCCCATGGGC 
CACGTGACGC AGGTGGAGTA CTCGGCGCTC GGACAGGTCA GCAGACGGCT CGCGCCCGAC 
GGCACCACCG TTGAATACCG CTACGACAGC CACATTACCA GCGCGGGATT CCGAACGCGG 
CCCATCGGTC GGCTGCCGAT GTTCGCGTGC CAGACTTGCC GGCGCTACTT CAGTCGCACG 
GCCGCCCCCC CACTCGGCGA GAAACATCTC AAGAAACTCG ATCTATTCGT GTCCTTGCTG 
TCGCATCCGA TCTCGTGCGT TGATGCGGGC GAACAGATGG GCAGCCTATC GACCGACATC 
GGAAAACGCG TGACGGCCTG GCGCGCGTGG CTGTTGGAGC TCGACCCGAG CGGCAAGTGG 
GAGCGCCGCG TGAGGCTCAG CCATCGACCT CCGCATTGCC CGAACTGCGG CAGTCACCAG 
ACGCGTTTCG ATGAATGCTC GAACGGCGCC TTCCCACGGT TCAAATGCGC GAATTGCGGG 
ACCAAATTCA CCCGACGCCG CGGCACGCCG TTCGTCAATG CGAAGATGAG TTCGCCCGAG 
CGCATGCGCC TGGTCATTCG GCGCCTGTCG CTGCCGTTGT TGGTCATGCA GGTGGCGGAC 
CTTGTCGGCA CGAGCCATGG GATGGTCCGG AAATGGCACA GCATGTTCAC CGATTTTGCG 
GATCGGCTCG AACCGAGTGG CAGTCTTTCA GCGCGGATCA GGTTGCGCTC GAACTCTGCC 
AATGCGCCGA ACAAATGA

Protein sequence

MGRASAMIDP AGRTTAWEYD AYGSLLVQTL PDGSAVRTEF DLDHRPVCMT LIGGRQWGYE 
WNTFGNLLAQ SDPSGAISRY TYDEYGQLVE HTGPRGASTR FDYHPDGNLA AQIDALGHRT 
QYRYDARGYL GEAIDALGQQ SQYEYDRNGH LTRAIEPGGR EIHCAYDADG NLSRHRDPMG 
HVTQVEYSAL GQVSRRLAPD GTTVEYRYDS HITSAGFRTR PIGRLPMFAC QTCRRYFSRT 
AAPPLGEKHL KKLDLFVSLL SHPISCVDAG EQMGSLSTDI GKRVTAWRAW LLELDPSGKW 
ERRVRLSHRP PHCPNCGSHQ TRFDECSNGA FPRFKCANCG TKFTRRRGTP FVNAKMSSPE 
RMRLVIRRLS LPLLVMQVAD LVGTSHGMVR KWHSMFTDFA DRLEPSGSLS ARIRLRSNSA 
NAPNK