Gene BURPS668_A1987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1987
Symbol
ID	4886596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	1924372
End bp	1925823
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	61%
IMG OID	640131925
Product	hypothetical protein
Protein accession	YP_001062982
Protein GI	126443667
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCTCAA TGCTCTATTT TCCGATGGTA TCGGCTCTGA GCTTGCTCGG TGCCGACGCG 
CCGACGCACT TGCGTTCGCA CTTGAAGTTG ATTCTGGGCG GCGAGTTCAA TGCGGCGCTC 
GAAAGATCGA GCGAATGGGC CGAAACGACG GTGGCATCGG AGCGGACATC ATGGGATCTG 
CAATTGCACG CGGATCTGCA GCTGGTGCTT GGCTTCGAAG TCGAAGCCGA AGAAAACTAT 
CGGCGCGCCC AGCGAAAAAT TCGCGGCTCA AACAGTAAGA TTCGCATCGC GACCTGCCGG 
AACGCCGCGT GGCAAGCCCT GTTCCGCTAC CGGGTCACGA CCGCGCTCGC GTGTTTTTCC 
CGAATCTGCG ACGAGCCCGG CATCGAGGCC GGCGGATTGG TGGAGGCGCG CTTTGGGATC 
GCCTGCGCGC TCTATGAAAT GGGGCGGATA GACGATGCGT TTGATGCGAT CGATTCGATG 
GAGAAGATCG CCGAACAGCA ATCGGACGAG ATGCGCGCGC ACTGGAAAGA CTTGATCGCC 
GTGTTGCGTT TCGATCTCGT CGTGCAAAGC GAATTGCGCC GGGCTGCGGC GTTCGTCGAT 
CATGTGTATT GGCAATCTGC GCAGTCGATG AGCCGGGTGG ACCGCGCGCA CGGTGTGTCG 
GAGGCCGCCG TATCCGTCGA GACGCCGCTG CTGCGCGGCC GGGTGGCCTA TCTGCTGCAG 
TTGCGATGCG CGGCCGCGGG CAATCGGGAC GCCGTCGCCG AGTTGGCGCG TTGCCTCGAT 
GCGGCGGGCG AGCAGGGATT CGTCGACTTT CGATACACGC TGCGCCTCGA GATTGCGCTC 
GCCCTGCTCG CGGGCGACGC GCCCAATTTG GCGCAATTCG TGTTGGAGCC GATTTCCGAT 
ACATTGCATG GCGCAGAGTC GAGCCGCCGC TATCGGGAAT ATTTCTATTG CGCCGCGAAG 
GTGCATCTGG CGCAGGACCA CACGCAGGAA TCGCTGGCCT TATACCGACG CTACGCGCTG 
ATCGCGATGA GATGTCTGCG CGAGGACGCG CTGATCGGCA GGCAGTTCCT GGTCGGGCAG 
GAACTGAAGC AGCTTCCTCA GTCCGACGAT GTGACCGTGC GCTTGCCGTT GAAATATCGG 
CGCGCCTATC ACTATATTCT CCAGAATCTC AACCGTAGCG ACCTTTCGGT TCGGGAGATC 
GCGGCGGAGA TCGGCGTCAC GGAGCGCGCG CTGCAGAACG CATTCAAGAT CTACCTCGGG 
CTTTCCCCGC GTGAGCTGAT CCGCTCGCGG AGAATGGAGC GTATCCGCAC GGAACTCGTC 
GATTTCACGT TGACGGGTGA GCGCAACGTC AAGGAGGCGG CCCGAAAATG GGGTGTCCAG 
AATGGTTCGA CACTCGTGAT CGCCTATCGG AAGGAGTACG ACGAAACCCC TTCGGAAACG 
CTCGCGCGCT GA

Protein sequence

MFSMLYFPMV SALSLLGADA PTHLRSHLKL ILGGEFNAAL ERSSEWAETT VASERTSWDL 
QLHADLQLVL GFEVEAEENY RRAQRKIRGS NSKIRIATCR NAAWQALFRY RVTTALACFS 
RICDEPGIEA GGLVEARFGI ACALYEMGRI DDAFDAIDSM EKIAEQQSDE MRAHWKDLIA 
VLRFDLVVQS ELRRAAAFVD HVYWQSAQSM SRVDRAHGVS EAAVSVETPL LRGRVAYLLQ 
LRCAAAGNRD AVAELARCLD AAGEQGFVDF RYTLRLEIAL ALLAGDAPNL AQFVLEPISD 
TLHGAESSRR YREYFYCAAK VHLAQDHTQE SLALYRRYAL IAMRCLREDA LIGRQFLVGQ 
ELKQLPQSDD VTVRLPLKYR RAYHYILQNL NRSDLSVREI AAEIGVTERA LQNAFKIYLG 
LSPRELIRSR RMERIRTELV DFTLTGERNV KEAARKWGVQ NGSTLVIAYR KEYDETPSET 
LAR