Gene Mvan_5220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5220
Symbol
ID	4644321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	5589997
End bp	5590989
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	67%
IMG OID	639808695
Product	hypothetical protein
Protein accession	YP_955997
Protein GI	120406168
COG category	[R] General function prediction only
COG ID	[COG1545] Predicted nucleic-acid-binding protein containing a Zn-ribbon
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.146278
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.27671
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACCA GCCAAAGCAG CCCGGTGCAG ATCGATCCCC ATGAGCCGCC GCTTTCCGCG 
CCGCTGAAGC TCGCATTCGA CTACACCCGT TCAGTAGGAC CGCTCCTCGG TGAGTTCTTC 
ACCGCCCTGA GGGAGCGGCG CATCGTCGGA GTTCGTGGAT CGGACGGCAA GGTACATGTC 
CCGCCCGCCG AGTACGACCC CGTCACCTGG GAGCAACTGA GCGAGATCGT ACCGGTGGCC 
AGTGTCGGCA CCGTGCAGTC GTGGACGTGG CAACCCGAAC CGCTCGAGGG ACAGCCGCTG 
GACCGTCCGT TCGCCTGGGC GCTGATCAAG CTCGACGGCG CAGACACCCC GCTGCTGCAC 
GCGGTCGACG CCGGCTCGTC GGACGCCATC AGCACCGGCA CGAGGGTGCA CGCGCACTGG 
GTGGACGAAC CCGTCGGCGC GGTCACCGAC ATCGCCTATT TCGCCCTCGG CGACCAGCCC 
GAGGATGTCC CTCCGGCGCC CGAAGGCCTC GATCCGGTGA CGATGATCGT GGTGCCCACG 
TCGATCGAGA TCCAGCACAC CGCATCACGT CCGGAGAGCG CGTTCCTGCG CGCACTGGAG 
CAGGGCAAGC TGCTCGGCAA CCGCACGGGC GCCGACGGAA AGGTGTACTT CCCTGCCCGC 
GAGGCGGATC CGGCCACGGG TGTGCAGCTC GACGAGTACG TCGAGCTGTC CGACAAGGGC 
ACCGTCACAA CCTTCGCGAT CATCAACATC CCGTTCGCCG GGCAGCGCAT CAAGCCGCCC 
TACGTCGCGG CGTACGTGCT GCTCGACGGC GCCGACATCC CGGTGCTGCA CCTGGTGTCC 
GACATCGACG CCGACAAGGT CCGGATGGGC ATGCGTGTGC AGGCGGTGTG GAAGCCCGAG 
GACCAGTGGG GTCTGGGCAT CGACAACATC GAGTACTTCC GGCCGACGGG CGAACCCGAC 
GCCGACTACG ACACCTACAA GCATCACCTC TGA

Protein sequence

MTTSQSSPVQ IDPHEPPLSA PLKLAFDYTR SVGPLLGEFF TALRERRIVG VRGSDGKVHV 
PPAEYDPVTW EQLSEIVPVA SVGTVQSWTW QPEPLEGQPL DRPFAWALIK LDGADTPLLH 
AVDAGSSDAI STGTRVHAHW VDEPVGAVTD IAYFALGDQP EDVPPAPEGL DPVTMIVVPT 
SIEIQHTASR PESAFLRALE QGKLLGNRTG ADGKVYFPAR EADPATGVQL DEYVELSDKG 
TVTTFAIINI PFAGQRIKPP YVAAYVLLDG ADIPVLHLVS DIDADKVRMG MRVQAVWKPE 
DQWGLGIDNI EYFRPTGEPD ADYDTYKHHL