Gene Avi_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_2101
Symbol
ID	7386902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	+
Start bp	1725811
End bp	1727010
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	61%
IMG OID	643651311
Product	hydrolase
Protein accession	YP_002549506
Protein GI	222148549
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCCA CTCTCGTCGT TTTCAATGCC CGCAATGGTC TCGGTGATCC CGTTGATATC 
GTTATTGCCG GTCATGCCAT TGCCGCTATC GGCCCAGCGG CGGGTGAGGG CGTTTCAACG 
GAAAAACCGC GCATCGATGC TCGAGGCGGT CTGGTCCTGC CGGGCCTGGT CGATGGTCAT 
GTACATCTGG ATAAAACGCT GATCGGCATG CCGTTCATTC CCCATATTCC CGGAGGCACG 
GTCGCCGAGC GGATCCGGGC CGAAAAAGCG CTCCGCCGCT CGCTGCCTTT GCCGGTCGAG 
GTGCGTGGGG CTAAGCTGCT GGAGAAGATG GCCACCTATG GCACCGTCGC CTGCCGTAGC 
CATGCCGATA TCGATACGGA AGTCGGGTTG GCAGGGCTAG AAGCCATATT GTCCCTGAAG 
CAAAGCCATG CTCATCTGGT CGATATTCAG ACAGTGGCGT TTCCACAGTC CGGCGTGCTG 
GCCGATCCCG GCACTGCTGA TCTGCTGGAG CAGGCGGTCA AGGCGGGTGC GGACCTGATC 
GGTGGTCTTG ATCCAGCCGG GATCGACGAT GACATTACCG GCCACCTGAA CGCGATTTTT 
GCTATCGCCG GACGTCACGG CGTGGGGGTG GATCTGCATC TACACGATCC GGGCCCGCTC 
GGCGCGTTCG AAATCCGCCA GATCGCCAAA CGGGCTTTGG CGCAGGGACT GCAAGGCAAA 
TGCGCCGTCA GCCATGCCTA TTGCCTGGGC GCTCTGGATG ATATGGATTT CGGGCGCACA 
GCGGAAGCGC TGGCGCGCGC CGATGTGGCG ATCATGACCA CCGGCCCCGG CGATACCAGC 
ATGCCGCCGA TCAAGCGGCT GAAAGCTGCG GGCGTGCGGG TGTTTTCCGG CAATGACAAT 
ATCCGCGATG CCTGGTCGCC GCTCGGCAAT GGCGATCTTT TGGAGCGGGC GAGCATTCTC 
TGCGACCGGC AGAACTTTCG CGCCGATGCC GACCTTGAAC ATGCTTTCGC GCTTGTCAGT 
ACCCTCTCGG CTGAGGTTTT AGGACGCAGC AATGCGACAC TCGGCAAAGG GTGTCCCGCC 
GATTTCATCA TTCTGCCGGT TGCCTCGATT GCCGAAGCAG TGGCGGCGCG TCCGATGGAG 
CGTATGGTGT TCAAGGCAGG TGTGCTGGTT GCCAGCAATG GCAATCTCGT CGCCTCATGA

Protein sequence

MSATLVVFNA RNGLGDPVDI VIAGHAIAAI GPAAGEGVST EKPRIDARGG LVLPGLVDGH 
VHLDKTLIGM PFIPHIPGGT VAERIRAEKA LRRSLPLPVE VRGAKLLEKM ATYGTVACRS 
HADIDTEVGL AGLEAILSLK QSHAHLVDIQ TVAFPQSGVL ADPGTADLLE QAVKAGADLI 
GGLDPAGIDD DITGHLNAIF AIAGRHGVGV DLHLHDPGPL GAFEIRQIAK RALAQGLQGK 
CAVSHAYCLG ALDDMDFGRT AEALARADVA IMTTGPGDTS MPPIKRLKAA GVRVFSGNDN 
IRDAWSPLGN GDLLERASIL CDRQNFRADA DLEHAFALVS TLSAEVLGRS NATLGKGCPA 
DFIILPVASI AEAVAARPME RMVFKAGVLV ASNGNLVAS