Gene Mvan_5742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5742
Symbol
ID	4644197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	6132204
End bp	6133355
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	69%
IMG OID	639809218
Product	extracellular solute-binding protein
Protein accession	YP_956513
Protein GI	120406684
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.252794
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCT CACCCAACCC CCCACGGTTG ACGTCCCGGG TTTTCGCGGT GGCCGCGTCG 
GCGCTGTTGT TCGGGAGTGC CGTGGCGTGC GCGCCGCCCG AGAAGGACAA CTCCAACGCC 
CAGACCGAGT CCGGGGTGAA CGCGGCCGAG GCCACCTCGG CAGGGGATTT CGGCGGCATG 
GAGGGGCTCG TCGAGGCGGC CAAGGCCGAG GGTGAGCTCA ATGTGATTGC GCTGCCGCCG 
GATTGGGCGA ACTACGGCGC GATCATCAAG GCGTTCTCCG ACAAGTACGG CATCAAGGTC 
AACTCCGCGC AGCCCGACGC CTCCAGCCAG GACGAGATCA ACGCCGCCAA CCAGCAGAAG 
GGCCGCAGCA GCGCCCCCGA CGTGTTCGAC CTCGGCCAGT CGGTGGCGCT GGCCAACACG 
GCGATGTTCG CGCCGTACAA GGTGGAGACG TTCGACGACA TCCCCGCGGC GTTCAAGGAC 
GCCGACGGCA CCTGGGTCAA CGATTACGGC GGCTACATGT CGATCGGGTT CGACTCGTCC 
AAGGTGCCGC CGGTGACCAG CGTCGACGAC CTGCTCAAGC CGGAGTACCA GGGCAAGGTG 
GCCCTCAACG GTGATCCGAC GCAGGCGGGT GCGGCGTTCT CCGGTGTCCT GATGGTGGCG 
TTGTCGCAGG GCGGCTCGGC CGACGACATC GCACCCGGCG TCGAGTTCTT CCGCAAACTC 
AAGGAGGCGG GCAACTTCCT GCCGGTCGAC CCGACCCCGG CCACCATCGA GTCCGGGCAG 
ACGCCCGTGG TGATCGACTG GAACTACACC AACTCCGCCG AGACGAAGAA GCTGCCGTCG 
TGGACGGTGC TGGTGCCGCC GGAGAACCCG GTGGCCGGGT ACTACTACCA GGCGATCAAC 
AGGGACGCCC CGCATCCCGC CGCCGCGCGG TTGTGGCAGG AGTTCCTCTA CAGCGACGAG 
GGCCAGAACC TGTTCGCCCA GGGCGGGGTG CGGCCGGTGC GGGCGGACAA CATGCTCGCC 
GACGGCACCC TCGATCCGGC GGTCGCCGCG GCGTTGCCGG TGGTCGACGG CCCGGTGACC 
GTGCCCACGC CGCAGCAGAC CGAGGCGGCG TCGAAGTACC TCGCGGAGAA CTGGGCCGCC 
GCGGTCGGCT GA

Protein sequence

MNTSPNPPRL TSRVFAVAAS ALLFGSAVAC APPEKDNSNA QTESGVNAAE ATSAGDFGGM 
EGLVEAAKAE GELNVIALPP DWANYGAIIK AFSDKYGIKV NSAQPDASSQ DEINAANQQK 
GRSSAPDVFD LGQSVALANT AMFAPYKVET FDDIPAAFKD ADGTWVNDYG GYMSIGFDSS 
KVPPVTSVDD LLKPEYQGKV ALNGDPTQAG AAFSGVLMVA LSQGGSADDI APGVEFFRKL 
KEAGNFLPVD PTPATIESGQ TPVVIDWNYT NSAETKKLPS WTVLVPPENP VAGYYYQAIN 
RDAPHPAAAR LWQEFLYSDE GQNLFAQGGV RPVRADNMLA DGTLDPAVAA ALPVVDGPVT 
VPTPQQTEAA SKYLAENWAA AVG