Gene Avi_9607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_9607
Symbol	hisC
ID	7381947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011991
Strand	-
Start bp	75240
End bp	76346
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	51%
IMG OID	643653282
Product	histidinol-phosphate aminotransferase
Protein accession	YP_002551453
Protein GI	222109188
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAATT CATGCCAACT CGTTTTTCCA TCTCACATTG AAAGGTTGCC GCGTTATAGG 
CCAGCAGCAG ATTTAGCTGT AGTCTCCGAG ACCTCAGCTG AACCTTTGGT CAACCTGGCA 
TCAAACGAAA ATCCTTATGG TACGAACCCG GGGTTTGCTG ATGCCTTAAA TGAAATCACG 
CGTTTTAACC TCGCGGAGTA CCCTGACCCC GATGCGCTCC GTCTGAAGAC CGCTATCGCG 
GCGAAAAACC ATGTTTCGAT CGATCAGCTA ATTATCGCGA ACGGCTCCGA TGAACTAATT 
GACTTGTCAG CTCGGACGCT GCTGGCGCCA GGAACGAACG CGATCTTCGA TGAGTATTCC 
TTTGTAGCCT ATCGTAAGGC GACTTACCTC GCAGGAGCTA CCGGTGTCAG TGTCCGACCT 
TCAGGCTGGA ATGCAGATCT CAATGAGATG CTTCGTGTCA TTGACACCAA TACTCGGATG 
ATATTTTTAG CAAATCCGAG CAATCCGACT CCAGGTTTTA TTTCAACGGC AGAATTTGAC 
AGCTTCATCA GCAGGGTTCC TGCTACCGTC CTTGTAGTGC TCGATGAAGC CTATATCGAT 
TTTGTTGAGC CGAACGAGCG GATCGATTGT AAGCTGCTGC TCCAATCAAG AAGCAATGTC 
TTTATAACGC GCACCTTCTC CAAGGCATAC GGACTTGCAG GTGTGCGGGT CGGCTATGGC 
ATCGGTTCGC CGACACTTAT TAACATGATG AACAGGATCA GGCAGCCCTT CTCCGTTGGC 
GTGTTGCCAC AACTGGCCGC GGTAAACGCG CTGGCCAATG AAGGCTTCGT GAACGAAACT 
AGAGCAAAAA ACATCGAGCA GAAGGCCAGA CTATCAGAAG GATTGAGCGA CCTTGGAATT 
GAGCACGCGG CATCCAAAGG AAATTTCATC ATTGTAAAGT TGCGTGCTCC ATCAGCAGCG 
CACGAGGCGC TGCAGGCGAA GCGAATCCTT GTGCGCCGCT TGGCTTCCTA TGGCCTGAGC 
GACTGGCTGC GTTTGACAAT TGGCACAGAA TCTCAAAACC GGATTGTACT TGACGCATTT 
CGAACCCTGA CACAACAAGC AAACTGA

Protein sequence

MSNSCQLVFP SHIERLPRYR PAADLAVVSE TSAEPLVNLA SNENPYGTNP GFADALNEIT 
RFNLAEYPDP DALRLKTAIA AKNHVSIDQL IIANGSDELI DLSARTLLAP GTNAIFDEYS 
FVAYRKATYL AGATGVSVRP SGWNADLNEM LRVIDTNTRM IFLANPSNPT PGFISTAEFD 
SFISRVPATV LVVLDEAYID FVEPNERIDC KLLLQSRSNV FITRTFSKAY GLAGVRVGYG 
IGSPTLINMM NRIRQPFSVG VLPQLAAVNA LANEGFVNET RAKNIEQKAR LSEGLSDLGI 
EHAASKGNFI IVKLRAPSAA HEALQAKRIL VRRLASYGLS DWLRLTIGTE SQNRIVLDAF 
RTLTQQAN