Gene BURPS668_A0420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0420
Symbol
ID	4885969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	385532
End bp	386563
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	65%
IMG OID	640130361
Product	transcriptional regulator
Protein accession	YP_001061426
Protein GI	126445047
COG category	[K] Transcription
COG ID	[COG0583] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGGCA TCCATGAATC CGGTAACGAT GCCGCGCAGT GTGCCCGCTT TACTTTTGCT 
CAAAAAGTAG CCTATAAACG AAATTATTTT GATTTCAAAT CAACAATGAA GGTCACGCTA 
GACGAACTTC AGGCCTTCGC GGCCGTGGTC GACACGGGTT CGATCACCGC GGCCGCGCAA 
CAGCTCGGCC TCACCGTGTC GGCGACGAGC CGCACGCTCG CGCGGCTCGA GGGCAAGCTC 
AAGACCACGC TGCTGCGCCG GACCACGCGC CGCCTCGAGC TGACCGAGGA GGGCCGGACG 
TTCCTCAACA GCGCGCGGGC AATCATCGAT TCGGTCGAAA GCGCGGAAGA GCAGATGCTC 
GCGCGGCGCG AGAAGCCGTC CGGCCGGCTG CGGGTCGACG CCGCGTCGCC GTTCATGCTG 
CATGTGATCG TGCCGCTCGT GCGCGGCTAT CGGGAGCGCT TCCCGCGCGT GGAGCTGGAG 
CTGAACAGTA ACGAGGGCGT CATCGATCTG CTCGAGCGGC GCACCGACGT CGCGATCCGG 
ATCGGCCGCC TGAAGGATTC GACGCTGCAT AGCCGGCTCA TCGGCAATAG CCGGCTGCGC 
ATCCTCGCGA GCCCCGCGTA TCTCGACGCG CACGGCCAGC CGCGCAAGGC CGGCGATCTC 
GGCAAGCATG CGCTGCTCGG CTTCAATCAG CCGGAATCGC TGAACGTGTG GCCGATCCTC 
GGCGCGGACG GCGAGCCTTG CCGGATCGAG CCGGCCGTGT GGTCGTCGAG CGGCGAGACG 
CTCAGACAGC TCGCGCTCGA CGGCGCGGGC ATCGTCTGCC TGTCGGATTT CATGACCGCG 
CAGGATCGCG AAGCGGGCCG CCTCGTGCAG ATCCTCGCGC GCCACACGCA AGACGTGCGG 
CAGCCGATTC ATGCGGTCTA TTACCGGAAC ACGGCGATTT CGTCGCGAAT CGCGTCATTC 
GTCGATTATC TGGTCGACGC GCTCGGCGGC GGGAATGCCG CGCAAAAGGC GGCGGCATGG 
ACGCGTCCGT GA

Protein sequence

MMGIHESGND AAQCARFTFA QKVAYKRNYF DFKSTMKVTL DELQAFAAVV DTGSITAAAQ 
QLGLTVSATS RTLARLEGKL KTTLLRRTTR RLELTEEGRT FLNSARAIID SVESAEEQML 
ARREKPSGRL RVDAASPFML HVIVPLVRGY RERFPRVELE LNSNEGVIDL LERRTDVAIR 
IGRLKDSTLH SRLIGNSRLR ILASPAYLDA HGQPRKAGDL GKHALLGFNQ PESLNVWPIL 
GADGEPCRIE PAVWSSSGET LRQLALDGAG IVCLSDFMTA QDREAGRLVQ ILARHTQDVR 
QPIHAVYYRN TAISSRIASF VDYLVDALGG GNAAQKAAAW TRP