Gene Bphyt_4038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphyt_4038
Symbol
ID	6278854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phytofirmans PsJN
Kingdom	Bacteria
Replicon accession	NC_010676
Strand	+
Start bp	53349
End bp	54419
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	61%
IMG OID	642615141
Product	NMT1/THI5 like domain protein
Protein accession	YP_001887794
Protein GI	187918763
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAAAA ACAACGGAGA CATCGTCACC ATGCCTCATG CTGTGACGCG CGTTGCGCGC 
GCCCTCCATG CCGCCGTCGC GGCGTCGCTC ACGATCTTCC TGCTCGCGCA GCCGGCTGCC 
CCCGCGCGGG CCGACTCGCC CGAAAAAATC GTCATCATGG TGGGCGGTAT TACCAAGCTC 
ATCTATCTGC CCGCACGCCT GACCGAACAG CTTGGGTACT TCAAGGCGGA AGGACTCGAC 
GTCGAACTGC AATCGCAGCC GGCGGGCGTC GATGCGGAAA ACGAACTGCT CGCGGGCGGC 
GTGCAGGCCG TAGTCGGCTT CTACGATCAC GCGATCGATC TGCAAGCCAA GGGTAAGGAA 
ATCAAGGCGA TCGTCGTGTT TGGCCAGGTG CCCGGCGAAG TGGAGATGGT CGCGGCCAGG 
GCGGCCGGTT CGATCAGAAG CATGGCCGAC GTGAAGGGTA AAACGCTCGG CGTGACGGGG 
CTCGGTTCTT CGACCAACTT TCTCACGCAG TACCTCGCCA GCCTCAAAGG CGTGCCGCGT 
TCACAGTACA CGGTGCTGCC GGTGGGCGCG GACAACAGCT TTATCGCGGC GATCCGGCAA 
GGGCGTATCG ATGCGGGCAT GACTACCGAG CCGACTGTCT CGCAACTGCT GAAATCCGGC 
GACGCCAGGG TACTGGTGGA CATGCGTAAT GTCGAAGGTA CACGCGCCGC GCTCGGTGGA 
ACTTATCCGG CCTCAAGCCT GTATGTGCAG AGCGCGTGGC TCGACACGCA CCCGCAAGAG 
GCGGCCAAAC TGGCGCGCGC ATTGGTGAAG ACGTTGCGAT ATCTGAATAC ACATAGCGCC 
GAAGAGATCG CCGCGCAGAT GCCGAAAGAC TACATCGGCA ATGACGAGGC GCTTTATGTG 
AGCGCGTTGA AGGCCTCGCT GCCGATGTTC ACCGCCGACG GCAAGATGCC CGCCGACGGG 
CCGGAAACGG TGCTCAAGGT GCTGGCGGGT TTCAACCCTT CGGTGAAGGG TCGTCATATC 
GATCTGTCGA GAACCTTCAC CAATCAGTTC GTCAATGAAG TGAAACCGTA G

Protein sequence

MRKNNGDIVT MPHAVTRVAR ALHAAVAASL TIFLLAQPAA PARADSPEKI VIMVGGITKL 
IYLPARLTEQ LGYFKAEGLD VELQSQPAGV DAENELLAGG VQAVVGFYDH AIDLQAKGKE 
IKAIVVFGQV PGEVEMVAAR AAGSIRSMAD VKGKTLGVTG LGSSTNFLTQ YLASLKGVPR 
SQYTVLPVGA DNSFIAAIRQ GRIDAGMTTE PTVSQLLKSG DARVLVDMRN VEGTRAALGG 
TYPASSLYVQ SAWLDTHPQE AAKLARALVK TLRYLNTHSA EEIAAQMPKD YIGNDEALYV 
SALKASLPMF TADGKMPADG PETVLKVLAG FNPSVKGRHI DLSRTFTNQF VNEVKP