Gene VC0395_A1819 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1819
Symbol	purM
ID	5136261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	1933885
End bp	1934925
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	50%
IMG OID	640533276
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001217743
Protein GI	147675067
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGGTA ATAATCCATC TCTCAGCTAC AAAGATGCAG GTGTCGATAT TGATGCAGGT 
AATGCACTCG TTGAACGAAT TAAAGGCGCC GTGAAGCGCA CCCGTCGCCC TGAAGTTATG 
GGTGGCCTAG GTGGTTTTGG CGCACTGTGT GAACTGCCAA CCAAATACAA GCACCCTGTT 
TTAGTCTCTG GCACTGACGG CGTAGGTACC AAACTGCGTC TCGCTCTGGA TATGAAAAAA 
CACGACACCA TAGGTATCGA TCTGGTGGCG ATGTGCGTCA ATGATCTGAT TGTTCAAGGC 
GCTGAGCCGC TGTTTTTCCT CGATTATTAC GCGACAGGCA AACTGGATGT GGATACGGCT 
GCTGAAGTGA TTTCTGGTAT TGCCGATGGC TGTTTGCAAG CGGGCTGCGC GCTGATTGGC 
GGCGAAACCG CGGAAATGCC AGGCATGTAC GAAGGTGAAG ACTACGACGT GGCAGGTTTT 
TGTGTCGGTG TCGTCGAAAA AGAAGAGATC ATCGACGGCA GTAAGGTACA AGTGGGTGAT 
GCGCTGATTG CGGTTGGCTC AAGCGGCCCA CACTCCAACG GTTACTCGCT GGTACGTAAG 
ATTTTAGAAG TCTCTAAAGC CGATAAGAAT GAGCGGTTAG CAGGCAAAAC CATTGGTGAG 
CACTTACTCG CACCGACCAA AATTTATATC AAATCTGGCT TAAAGCTGAT TGCTGAACAT 
GACATTCATG CGATTTCACA CATCACTGGC GGTGGCTTCT GGGAAAACAT TCCACGCGTA 
TTGCCAGAAG GTACAAAAGC CGTGATCGAT GGTAAGAGCT GGGAATGGCC AGTGATTTTC 
CAATGGTTAC AGGAAAAAGG TAACGTGACC ACTCACGAAA TGTACCGCAC CTTCAACTGT 
GGTGTCGGTT TGATCATTGC ACTGCCAAAA GATCAAGCCA ATGCGGCCGT TGCGCTACTG 
CAAGCAGAAG GCGAAACCGC ATGGGTCATC GGCGAAATCG CAGCCGCCAA TAGCAACGAA 
GCACAGGTAG AGATCAACTA A

Protein sequence

MSGNNPSLSY KDAGVDIDAG NALVERIKGA VKRTRRPEVM GGLGGFGALC ELPTKYKHPV 
LVSGTDGVGT KLRLALDMKK HDTIGIDLVA MCVNDLIVQG AEPLFFLDYY ATGKLDVDTA 
AEVISGIADG CLQAGCALIG GETAEMPGMY EGEDYDVAGF CVGVVEKEEI IDGSKVQVGD 
ALIAVGSSGP HSNGYSLVRK ILEVSKADKN ERLAGKTIGE HLLAPTKIYI KSGLKLIAEH 
DIHAISHITG GGFWENIPRV LPEGTKAVID GKSWEWPVIF QWLQEKGNVT THEMYRTFNC 
GVGLIIALPK DQANAAVALL QAEGETAWVI GEIAAANSNE AQVEIN