Gene Mvan_3778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3778
Symbol
ID	4645141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	4020476
End bp	4021897
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	67%
IMG OID	639807243
Product	hypothetical protein
Protein accession	YP_954566
Protein GI	120404737
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.499553
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGCAT ACGCGGAGCC TGCGGAACTC ATCGACGCGA TGAGTTCGGC GGCGCGTGCG 
GAGTCGGCGG CGATCGCGCG GCGGCTGGAA GCGGTCGCGG CGTTGTTTCG TTCCCGTAAG 
TGCGATTACG CCGAGGCAGG GTTCTTGCAC ACTGATGTGT ATGAGGCGGT GGCGGCTGAG 
GTGTCGGCCG CGCAGAACAT CAGCCGGTCG CGGGCCGGTT ACCAGGTGGA GATGGCAGTG 
TCGCTGTACA CCCGGTTACC GAAAGTGGCC GAAGCGTTCG CGCGGGGCGA TATCGATTTG 
CGGATGGTGC AGATAGTTCT GGCCCGCACC AAGAACGTTG AGGATGACGT GATCGGCGGC 
CTGGACAAGG CCATCGCGCC CAAATTGTCG CGGTGGATGC GGTTGTCCAA GAACGATCTT 
CGGGATCGGG TGGATCTGTG GGTGGCGGAT TTCGATCCGG CCGCGGTGCG GGTGCCGCCG 
GAAGCGAAGG ACAACCGCTA CTTCGATGTG ACACCCGATG TGCCGGGGAT GGCCTTCGCC 
GGAGGACTGC TCAACGCCCG TGATGCCGCG GCGTTGGATC AGCGTCTGGA GGCGATCGCG 
GCGACGGTGT GCAGCAACGA TCCACGCTCG CACAATAATC TGCGGGCCGA CGCGGCGGGG 
GCGCTCGGGC GGGGGGAGTC GACCCTGACC TGTGAGTGCG GCGCCGAGGA TTGCCCGGCC 
GCGGTGCTAC GGGAGTCCGC GGCGCAGGTG GTGATTCACA TCCTGGCCGA GCAGGCCACG 
GTGGACGGAG ACGGTGACAA GGCGGGATAC CTGCCGGGGT TCGGGGTGCT GCCGGCCGAG 
GAGGTCCGTG CCGCGGCCAA GACGGCGAAG CTCAAGCCGG TGCGATTGCC CGGCGCCGAA 
CCGGAGAAGG GCTACCGCCC GTCGGCCGGA TTGAAGGATT TTCTGCAGTG GCGTGATCTG 
ACCTGCCGCT TCCCGGGCTG CGACGCCCCG GTGGAGCGCT GCGATGTCGA CCATACGACG 
CGGTGGCCAT TCGGGGTCAC GCATGCCTCG GGGCTCAAGC ATTACTGCCG TACCCATCAT 
GTGATCAAGA CGTTCCTCAC GGGGGTGTAC GGCTGGCGCG ACGAGCAGCG TCGCGACGGC 
ACGGTCGTGC TGACCGCGCC GACCGGGCAC GTGTACACCA CCGAACCGCT TGGCGGACTG 
CTATTCCCGA CACTGGCGAC ACCGACCGCG CCACTGCCCG ACGTCGAAGT GCCCGAAGAT 
GACCCGGACA AGGCGGCGAT GATGCCGCGG CGGCGTACCC GTGAGCAGGA ACGGCGGGCT 
CGGATCGCGC GCGAACGCCG ACAACGCATC GAGATCAACG CCGAACGCGA ACGGCAACAC 
CAGGCCTGGC TCGCCGCAAC GTATGAACCA CCGCCGTTCT GA

Protein sequence

MFAYAEPAEL IDAMSSAARA ESAAIARRLE AVAALFRSRK CDYAEAGFLH TDVYEAVAAE 
VSAAQNISRS RAGYQVEMAV SLYTRLPKVA EAFARGDIDL RMVQIVLART KNVEDDVIGG 
LDKAIAPKLS RWMRLSKNDL RDRVDLWVAD FDPAAVRVPP EAKDNRYFDV TPDVPGMAFA 
GGLLNARDAA ALDQRLEAIA ATVCSNDPRS HNNLRADAAG ALGRGESTLT CECGAEDCPA 
AVLRESAAQV VIHILAEQAT VDGDGDKAGY LPGFGVLPAE EVRAAAKTAK LKPVRLPGAE 
PEKGYRPSAG LKDFLQWRDL TCRFPGCDAP VERCDVDHTT RWPFGVTHAS GLKHYCRTHH 
VIKTFLTGVY GWRDEQRRDG TVVLTAPTGH VYTTEPLGGL LFPTLATPTA PLPDVEVPED 
DPDKAAMMPR RRTREQERRA RIARERRQRI EINAERERQH QAWLAATYEP PPF