Gene Mvan_1137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1137
Symbol
ID	4646701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	1208513
End bp	1209793
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	65%
IMG OID	639804636
Product	HipA domain-containing protein
Protein accession	YP_951979
Protein GI	120402150
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.965885
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCC GAACCCTGCG GGTCTACCTC GATGGAACCC CGATCGGCAC CATGACGCAA 
TCCAGCCATG GTGCTTTGGG TTTCACCTAC GACGGCGCGT ACACCGGGCA GGACGACCCG 
ACACCGCTGT CGCTGTCGAT GCCGATCCCT TCCTCCCGGC ATCGGGACAA AGCAGTGCGG 
GCCTACCTGG AGGGCTTGCT TCCGGACCGC GAAGGTGTGC GACAGCGATG GGCACGCGAG 
TACAGCGTGT CGCCGAACAA CCCGTTCGGG CTGCTGGCGC ACGTCGGTCG CGACGCCGCC 
GGCGCCGTCC AAATCCTTCC GCCCGACCTC GACCCGGCCG ACGCCCGCGC CTGCGACGGC 
GACATCCAAT GGCTCAGCGC GGCCGACCTC TCAGATCTCG CCCGAGATCT CACCACCCAC 
CAATCCGACT GGAATCCAGG CAGATTCGAG GGTCGGTGGA GCCTCGCCGG CGCACAACCG 
AAAATCGCGC TGTTCCGAGA CACGAAGTCC GGACGGTTCG GCATCCCGCG TGATTCCACA 
CCGACGACGG CGATCCTCAA GCCCGCACTC GTCGGCTACA CACAACATCA CATCAACGAG 
GCGTTGTGTC AGCGTGCCGC ACGTGAGGCT GGGCTGCTCG CCGCCGAATC CGAGCTGACG 
CAGATCGGTG AGGTGCAGGT GTTGATCTCG ACGCGCTACG ACCGCCGTCA CGACGGGACG 
TTGTGGCATC GGGTCCACCA GGAAGACATG TGTCAGGCGT TGTCGGTCCA CCCCGCCCTC 
AAATACCAGT CCGATGGAGG GCCAGGTGTC GGTGATGTCG CCGACCTGCT CAACAGGCTC 
CCGGTCGAGG ACCGCGCTGT GAATGCCGAG CGATTCTTCA AGGCGCTCAC CTACAACGTC 
CTGATCGGCG GCACCGACGC TCACGCGAAG AACTACTCAC TTGTCCTCAT GGGATCACGC 
GCCCAGGTGG CGCCCATGTA TGACGCCGCC TCGGCTGCGC CGTACGACCA GCGCGACCAC 
CTGCGTTCCT CCATGAAGAT CGGTGAACAC TGGAAAATGC TCGATGTCAA CAATTCCGAC 
TGGGCCAAGG TGGGACGCCG TCTCGGCATC TCCGCGGAGC AGGCCACGGC GTGGGTAGGC 
GAACTCCGCA ACAAACTTCC GGATGCATTC GAGCGCGCCG TGGCTTCACT GGCGCTGAGC 
GCACGACCCG AGGCGGGACG CATGGCCGAG CGGATCATTG AGCACGTCGC GGGTACCTGG 
AAGCCCACTC TGCCTCGCTG A

Protein sequence

MATRTLRVYL DGTPIGTMTQ SSHGALGFTY DGAYTGQDDP TPLSLSMPIP SSRHRDKAVR 
AYLEGLLPDR EGVRQRWARE YSVSPNNPFG LLAHVGRDAA GAVQILPPDL DPADARACDG 
DIQWLSAADL SDLARDLTTH QSDWNPGRFE GRWSLAGAQP KIALFRDTKS GRFGIPRDST 
PTTAILKPAL VGYTQHHINE ALCQRAAREA GLLAAESELT QIGEVQVLIS TRYDRRHDGT 
LWHRVHQEDM CQALSVHPAL KYQSDGGPGV GDVADLLNRL PVEDRAVNAE RFFKALTYNV 
LIGGTDAHAK NYSLVLMGSR AQVAPMYDAA SAAPYDQRDH LRSSMKIGEH WKMLDVNNSD 
WAKVGRRLGI SAEQATAWVG ELRNKLPDAF ERAVASLALS ARPEAGRMAE RIIEHVAGTW 
KPTLPR