Gene BURPS1106A_A2831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2831
Symbol
ID	4906355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2774607
End bp	2776478
Gene Length	1872 bp
Protein Length	623 aa
Translation table	11
GC content	71%
IMG OID	640145934
Product	hypothetical protein
Protein accession	YP_001076860
Protein GI	126456530
COG category	[S] Function unknown
COG ID	[COG3519] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03359] type VI secretion protein, VC_A0110 family

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.843813
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATACGC GCCTGCTCGA CTACTACAAC CGCGAGCTCG CGTATCTGCG CGAGTTGGGC 
GGCGAGTTCG CGCAGCAGTT TCCGAAAGTG GCCGCGCGCC TGCGGATGCA CGAATCGGGG 
CCGCCCGATC CGTACGTCGA GCGGCTGCTC GAAGGCTTCA GCTTTCTCAC CGCGCGCGTG 
CAACTGAAGA TGGACGCGGA GTTTCCGCGC TTCACGCAGG CGCTGCTCGA CGCGGTGTAT 
CCGGGTTACG TCGCGCCGCT TCCGTCGATG GCGATCGTGC AGTTCACGCC GATGATGAAC 
GAAGGCAGCC TCGCGCAGGG CTACCGGCTG CCGGCGGGCA CCGCGCTGCG CGCGCGGCCC 
GCCGCGGCCG AACAGACCGC GTGCGAGTTT CGCACCGCGC ACGATCTGAC GCTGTGGCCG 
CTGGAGCTCG CGGGCGCTTC GGTGACGGGC GCGCCCGCGT ATCTGCCGCG TTCGGCGACG 
GCCGCGCGCC GCGACGTGCG CGGCGCGCTG CGCATCCGGC TGAAGGCGCG CGGCGGCGCG 
GGCCTCGCGC AACTGCCGAT CGATCGGCTG ATGTTCCACC TGGCGGGCCC CGAGCGCGAC 
GCGCTGCATC TGCTCGAACT GATCGCCGGG CATACGATCG GCGTCGTCTG CCACGACGCG 
GCGCAGCCGC CGCGCTGGCT GCACGCGCTT GGCGCGCACG CGCTCGCGCA TCAGGGCTTC 
GACGCCGATC AGGCGCTGCT GCCCGACGAA GGCCGCAGCT TCCACGGTTA CCGGCTGCTG 
CGCGAGTACT TCGCGTTTCC CGCGCGCTTC CTGTTCTTCA GCATCGAAGG ATTGCGGCCC 
GCGCTCGCGC GCGCGACGGG CGACACGTTC GAGCTGACGC TGCTGCTCGA TCGGCACGAC 
GCGGCGCTCG AGAACAGCGT CGATGCGCGG CACCTCGCGT TGAACTGCAC GCCGGCCGTC 
AACCTGTTCG CGCGGCGCGC GGACCGCATT CCGGTCCATC CGGGCGCGCG CGAGCATCAT 
GTCGTCGTCG ATCGCAGCCG GCCGCTCGAC TACGAGGTCT ACGCGGTGCG GCGGCTCGCG 
GGCGAGCAGC GCGACGACGG GCAGATGCGC GCGTTCCGGC CGTTCCATGC GTCGTTCGCG 
GGCGACGGCG GCAATTACGG CGCGTACTAC ACGGTGCGCC GCGAGCCGCG CCTCGTGTCC 
GCGCAGGCGC GCGCGAACGG CACGCGCACC GGCTACGTCG GCAGCGAGAC GTTCGTGTCG 
CTCGTCGATA GCGCGTGCGC GCCGTATGAC GAATCGATCC GCTATCTGTC CGTCGACACG 
CTGTGCACGA ACCGCGATCT CGTCCTGCTG TTGCCGGCGG GCGACGCGAA CGCGTTCACG 
CTGCGCGTGT CGGCGCCCGT CGAGCGGATC GCCATGATCC GCGGGCCGTC GCGGCCGCGC 
CCGCCGCTCG CCGACGCGCA GAGCGCGTGG CGGCTCGTGA GCCATCTCGG GCTCGCGCGC 
CACACGCTGA CCGATGTCGA CGACGAAGAA GGCGCGCGCG TGCTGCGCGA ATTGCTCGGC 
CTGCACGCGG ACCCGGCCGA TGCGGCGATG CGCCGGCAGA TCGACGGCGT GCATCGTGTC 
GCGTTCGCGC CGGTGTTTCG CCGGCTGCCC GCCGCCGGGC CGCTGATGTT CGGGCGCGGC 
GTGCAGGTGG ACGTGACCGT CGACGATCAT GCGTTCTCCG GCGACAGCCC CTATTTGCTC 
GGCGCGGTGC TCGAGCAGTT TTTCGCGCGG CACGTGTCGA TCAACTCGTT CGCCGAATGC 
GTGCTGAGCA GCGCGCAGCG CGGCAGGCTC GCGCAATGGC CGGCGCGCGT CGGCAGGCGG 
CCCGCGATAT GA

Protein sequence

MDTRLLDYYN RELAYLRELG GEFAQQFPKV AARLRMHESG PPDPYVERLL EGFSFLTARV 
QLKMDAEFPR FTQALLDAVY PGYVAPLPSM AIVQFTPMMN EGSLAQGYRL PAGTALRARP 
AAAEQTACEF RTAHDLTLWP LELAGASVTG APAYLPRSAT AARRDVRGAL RIRLKARGGA 
GLAQLPIDRL MFHLAGPERD ALHLLELIAG HTIGVVCHDA AQPPRWLHAL GAHALAHQGF 
DADQALLPDE GRSFHGYRLL REYFAFPARF LFFSIEGLRP ALARATGDTF ELTLLLDRHD 
AALENSVDAR HLALNCTPAV NLFARRADRI PVHPGAREHH VVVDRSRPLD YEVYAVRRLA 
GEQRDDGQMR AFRPFHASFA GDGGNYGAYY TVRREPRLVS AQARANGTRT GYVGSETFVS 
LVDSACAPYD ESIRYLSVDT LCTNRDLVLL LPAGDANAFT LRVSAPVERI AMIRGPSRPR 
PPLADAQSAW RLVSHLGLAR HTLTDVDDEE GARVLRELLG LHADPADAAM RRQIDGVHRV 
AFAPVFRRLP AAGPLMFGRG VQVDVTVDDH AFSGDSPYLL GAVLEQFFAR HVSINSFAEC 
VLSSAQRGRL AQWPARVGRR PAI