Gene BURPS668_A2507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2507
Symbol
ID	4885982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2421456
End bp	2423693
Gene Length	2238 bp
Protein Length	745 aa
Translation table	11
GC content	69%
IMG OID	640132444
Product	TonB-dependent copper receptor
Protein accession	YP_001063501
Protein GI	126443902
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID	[TIGR01778] TonB-dependent copper receptor

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACATCCA CATTCCTGCG TCACGCGCCC GCCGCGCGTG GAGACCACGC GCGCCGCCGG 
CGGCGCGCGA TCACGCTTAC CGTTCCCGCG CTCGCCGCGG GCGCCTTTCA CCTCGCGCCG 
GCCGTCGCGC AGACGAGCGA GGCCGTGCAC GGCCACGGCA CGCTCGGCGC GTCCGGCGTA 
GCGAGCCGCG CCGAGACCGA CGCGACGAGC GCCAAATCGG ACGGCGCGGT TCGCGAAGCG 
GCGAGCCGCA CGACAACCGG CGCCGCGCCG GACGCCACGA TGCTGCCGAC GATCGAAATC 
GTCGCGGCGC CCGAATCGAC GCCGCTCGTC GTCGTCACCG ATCCGAAGAC GCCGCGCCAG 
CCGCTGCCCG CGAGCGACGG CGCCGATTAT CTGAAGACGA TTCCCGGCTT CGCGTCGATC 
CGCAGCGGCG GCACGAACGG CGACCCGGTG CTGCGCGGGA TGTTCGGCTC GCGGCTGAAC 
ATTCTCGCGA ACGGCATGCC GACGCTCGGT GCGTGTCCCG GCCGGATGGA CGCGCCGACG 
TCGTACATCG CGCCCGAGAG CTACGACAAG GTGACGCTCG TCAAGGGGCC GCAGACCGTG 
CTGTACGGGC CGGGCGCATC GGCGGGCACG GTGCTGTTCG AGCGCGTGAC GCCGCGCTTC 
AAGACGCCGG GCATGCGCTT TGACGGCAGC GTCGTCGGCG GCTCGTTCGG GCGCAACGAT 
CAGAACGTCG ACGTGACGGC CGGCACGCCC GACTTCTACG GGCGCGTGAG CGCGAACCAT 
GCGCACTCGC AGGACTACGA GGACGGCAAC GGCCGCACGG TGCCGTCGCA ATGGGACAAG 
TGGAACGCGG ATGCGGCGCT CGGCTGGACG CCCGACGACA ACACGCGGCT CGAGCTGACG 
GCAGGCACGG GCGACGGCTA CGCGCGCTAT GCGGGCCGCG GAATGGACGG CGCGCATTTC 
CGGCGCGAGA CGTTCGGTCT GAAGTTCGAC AAGAAGCACA TCGGCGACGT GCTCGATCGC 
ATCGAGGCGC AGGTCTTCTA CAACGAAGCC GATCACGTGA TGGACAACTA CACGCTGCGG 
ATGCCCGATC CGACGAGCAG CATGCCGATG CGCATGGCCT CCGAAGTGCG CCGCCGCACG 
CTCGGCGCGC GCGTCGCGGC GACGCTGCGC TTGACCGACG CGTTCAAGCT CGTGACGGGC 
GTCGATGCGC AGTCGAACCG CCTCGACTCG CGCTCGGCGA TGGGGATGCA GAACTACGGC 
GACAAGCCGT GGAATCCGCA GGCGAACATG TGGAACGCGG GCGCGTTCGG CGAGCTGACC 
TGGTATGCGA GCGATGCGTC GCGCGTGATC GGCGGCGCGC GGATCGACTA TGCGGCCGCG 
CGCGACAAGC GCGCGACGAC GGGCGGCATG AAGATGAGCA TGCGCAATCC GACGTTCGAC 
GATCTCCGCT CGCGCGTGCT GCCGAGCGGC TTCGTGCGCT ACGAGCGTGA TCTCGCGTCG 
CTGCCCGTCA CGTGGTACGC GGGCATCGGC CATGCGCAGC GCTTTCCTGA TTACTGGGAG 
CTGTTCTCCG CCAAGCGCGG CCCGAACGGT TCGATCAACG CGTTCTCCGC GATCAAGCCC 
GAGAAGACGA CGCAGCTCGA CATCGGCGCG CAGTACAAGA GCGACAAGCT CGACGCCTGG 
GTGTCCGCCT ATGCGGGCTA CGTGCAGGAC TTCATCCTGT TCGACTATGC GACGGGCCCG 
ATGGGACAGA TCACGCGGGC GACGAACGTC AACGCGCAGA TCATGGGCGG TGAGGTGGGC 
GCGTCGTGGC GTCCGCTCGC GCCGTGGCGC TTCGAAGGGT CGCTCGCGTA TGCGTGGGGG 
CGCAACGTGC AAAGCGGTGC GCCGCTGCCG CAGATGCCGC CGCTCGAGGC ACGCTTCGGC 
GTCGAGTACA CTCGCGGGCC GTGGTCGGCG GGCGGGCTGT GGCGGGTCGT TGCGCCGCAG 
CATCGCTACG CGCTGAACGA GGGCAACGTC GTCGGCAAGG ACTTTGGTCC GAGCGCCGGT 
TTCGGCGTGC TGTCGCTGCA CGCGCAGTAC CACGTGAGCA AGACGGTGCA GATCTCGGTC 
GGCGTCGACA ACGTGCTCGA CAAGGCTTAT GCGGAGCACC TGAACCTCGC GGGCAACGCC 
GGTTTCGGCT ATCCGGCGAA TCTGCCTGTC ACCGAACCCG GCCGCACCGC GTGGGTTCGT 
TTGAGCACCA AGCTCTGA

Protein sequence

MTSTFLRHAP AARGDHARRR RRAITLTVPA LAAGAFHLAP AVAQTSEAVH GHGTLGASGV 
ASRAETDATS AKSDGAVREA ASRTTTGAAP DATMLPTIEI VAAPESTPLV VVTDPKTPRQ 
PLPASDGADY LKTIPGFASI RSGGTNGDPV LRGMFGSRLN ILANGMPTLG ACPGRMDAPT 
SYIAPESYDK VTLVKGPQTV LYGPGASAGT VLFERVTPRF KTPGMRFDGS VVGGSFGRND 
QNVDVTAGTP DFYGRVSANH AHSQDYEDGN GRTVPSQWDK WNADAALGWT PDDNTRLELT 
AGTGDGYARY AGRGMDGAHF RRETFGLKFD KKHIGDVLDR IEAQVFYNEA DHVMDNYTLR 
MPDPTSSMPM RMASEVRRRT LGARVAATLR LTDAFKLVTG VDAQSNRLDS RSAMGMQNYG 
DKPWNPQANM WNAGAFGELT WYASDASRVI GGARIDYAAA RDKRATTGGM KMSMRNPTFD 
DLRSRVLPSG FVRYERDLAS LPVTWYAGIG HAQRFPDYWE LFSAKRGPNG SINAFSAIKP 
EKTTQLDIGA QYKSDKLDAW VSAYAGYVQD FILFDYATGP MGQITRATNV NAQIMGGEVG 
ASWRPLAPWR FEGSLAYAWG RNVQSGAPLP QMPPLEARFG VEYTRGPWSA GGLWRVVAPQ 
HRYALNEGNV VGKDFGPSAG FGVLSLHAQY HVSKTVQISV GVDNVLDKAY AEHLNLAGNA 
GFGYPANLPV TEPGRTAWVR LSTKL