Gene BURPS668_A2971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2971
Symbol
ID	4887429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2826955
End bp	2828388
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	71%
IMG OID	640132907
Product	FHA domain-containing protein
Protein accession	YP_001063962
Protein GI	126445261
COG category	[T] Signal transduction mechanisms
COG ID	[COG3456] Uncharacterized conserved protein, contains FHA domain
TIGRFAM ID	[TIGR03354] type VI secretion system FHA domain protein

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACTGA CCGTTATCGA ACACGCGGGC GAGCCGGTCG GCACCGACGG CCGCAACGCC 
GTCGTGTTTC ATGCGCCGGG CGGCACGATC GGCCGGGACA GCGACAATCA CCTCGTGCTG 
CGCGACGACA CCCGGCAGAT CTCGCGCCTG CAGGCGCTGC TGCAGGTGGC CGACGACGCG 
TGCCTGCTGA AGAACCTGAG CAGCGTATCG ACGATCGAAG TGAACCGCGT GCCGATCGGC 
TACGCGCAGG CGCAGCGCCT GAACATGGGC GACATCATCC GAATCGGCCC TTACCTGCTG 
CGCGCGGAGC CCGACGACGC GACGATCGAG CGAACCGTCG AAGCCGCCAC CACGGCGGCC 
GCGGCGGCGC CGGCGGCGTC CGCCGCGCAG GCTCAGGCGA AGGGGGCGGG CTACAAACTG 
TGGGGCCTGC TGCACGAGCG CTTCGGGCTC GGCAAGGCAC AGGGCGCGGG CGAGCAGTCC 
GGCGCGCGCG CCGCGCCGTC GCGCCACCAC GATTCGCCGG CGTCCGCTGC GCCGCGCGAC 
CTGAATCAGC TGTCGACCGA TCCGCTCGAC CTGTTCGCGC AGCCGCGCGG CGATCCGGAT 
GCGCGAGCCG GCGCTGCGCG CGAAGGCGAA GGCCGCGCGC CGCCCACCGT CACGCAACCG 
GATCACGCGC CCGAGTGGAC GCAACACGTC CGCGTGCAGC CGGCGCAATC CGCGCCGCCC 
GCCGCCTCTC GCCCCGGCGC GCCCGCCGCG CGTTCGGGCG ATATCCCCGC AGCAGGCGAT 
GCGAGCGACA TGCCGTCGCG CGTGCGCGCG TCGCCGGCCC CCGCGCCGGC GACACCCGAG 
ACATTGCTGC AGGCGTTCTT CGAAGGCGCG GGGCTCGACA CCGCCGCCGA GCAGCATCAC 
TGGTCCGCCG AGCAGTTGTT CGTCGCGGGG CAGCTGCTCG CGCTGTTCGC CAACGGCACG 
GTCGAGCTGC TGTCGTCACG CAGCATCCTG AAGCGCGAAG TGAAGGCCGA CATGACGATG 
CTGCTCGACC GCGAGAACAA TCCGCTGAAG CTGCTGCCGG ACGGCAGCGC GGTGCTGCGC 
CAGATGTTCG GGCTGCCGCT GCCGGGCTTC ATGACGCCGC AAAGCGCCGT GTCCGACGCG 
TTCCAGGATC TGCACGCGCA CCAGATCGGC ATGGTGGCCG GCATGCGCGC CGCGCTGATG 
GATCTGCTCA CGCGCTTCTC GCCGCAGCGC CTGCGCGAGC GCGACGCCGC GCCCCACTGG 
TACGAGAAGC GCGTGCCGGC GCTGTACAAG GCGCGCCTCT GGGACCGCTA TGCAACCACG 
CATCGCGACA CGCTGTTCGC GATCGAGGAC GATTTCGCCT CCGTGTTCGG CAAGGCGTTC 
CTCAGCGCCT ACGACGCGGA AGTCGAGAGC TATCGCGGAC GCTGCCGCCG GTGA

Protein sequence

MQLTVIEHAG EPVGTDGRNA VVFHAPGGTI GRDSDNHLVL RDDTRQISRL QALLQVADDA 
CLLKNLSSVS TIEVNRVPIG YAQAQRLNMG DIIRIGPYLL RAEPDDATIE RTVEAATTAA 
AAAPAASAAQ AQAKGAGYKL WGLLHERFGL GKAQGAGEQS GARAAPSRHH DSPASAAPRD 
LNQLSTDPLD LFAQPRGDPD ARAGAAREGE GRAPPTVTQP DHAPEWTQHV RVQPAQSAPP 
AASRPGAPAA RSGDIPAAGD ASDMPSRVRA SPAPAPATPE TLLQAFFEGA GLDTAAEQHH 
WSAEQLFVAG QLLALFANGT VELLSSRSIL KREVKADMTM LLDRENNPLK LLPDGSAVLR 
QMFGLPLPGF MTPQSAVSDA FQDLHAHQIG MVAGMRAALM DLLTRFSPQR LRERDAAPHW 
YEKRVPALYK ARLWDRYATT HRDTLFAIED DFASVFGKAF LSAYDAEVES YRGRCRR