Gene Ava_3071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3071
Symbol
ID	3681051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	3810486
End bp	3811655
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	46%
IMG OID	637718416
Product	inosine/uridine-preferring nucleoside hydrolase
Protein accession	YP_323575
Protein GI	75909279
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1957] Inosine-uridine nucleoside N-ribohydrolase
TIGRFAM ID	[TIGR02595] PEP-CTERM putative exosortase interaction domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.474461
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAAAA TTCCTAATGT GCAGAAGTTG TTTTCTACTG CTGCTTCTTT AGTATCAATC 
ACAGCAATTT TTTGTAGCCA ACCTGTACTT GCAGCCTCTT TTAAGCCAAC CCCCCTAATC 
ATCGACGACG ATGGCAGCCA AGACGGCATG ACTGCATTGG CTTATATGCT AGCCAATCCC 
AAATTTGATG TCCAAGCAAT TACCATCGCC CAAGGTATAG CCCGCCCAGA AAGCTTTGTG 
AACAACCTGG AACGGATGCT AGGCAGACTA AATGCTTCTG GCATCCCTGT TGGTATCGGC 
AGATCCACTC CCCTGGCAGG AAATAATACT TTCCCAGAAT TTATTCGCAC TGGTGCAGAC 
ACTTTTTGGT CTCCCTTCGT CCAACTACCT GATACAGCAC CACCTATAGT AACTCGACCA 
GCCGCAGAAC TGATTGTGGA GAAAGTGAAG CAGTCATTAG CACCTGTAGC AATCTTGGCA 
ACTGGATCTT TAACCAATAT TGCTGAAGCA TTACGGCTTG ACCCCACCAT TATCAACAAC 
ATTGCCATCA TCGAAATCAT GGGAGGCGCA GTTTTCGTAC CTGGAAATCT CCCAGTCCTG 
CCTGATCCCC CATTTTCTAC CAACACGACA GCTGAGTTCA ACATCTGGGT TGACCCTTTA 
GCAGCACAAG AAGTATTTGC AGCCGGAGGG CAAGGATTAA AAATTCAGTT GACCCCCCTG 
GATGCTACAA ACCAGATTGC CTTTTCTCGT GCCGATCAAC AAGCATGGCT AGCTACTGCA 
ACACCAGAAA GTAAGTTAGC AGCAGAATTT TTAGACTTTG CCTTGACCAT AATTCAAAGT 
AACAATGACC CCAACCCAGC TTGGGATCTA GTTGCAGCCA TTAACTTGAG TGAACCAGAT 
TTCTCAGTAG AAACTCCTTT ATACTTAGAA GTTGATACGA CCTCAGATCC TGGGGGTACT 
CAAGGGCAAA CTCGTGCTAT TTCTAATTTG CCCCCCAATG TTCTAGTTTC CCTCAACCCC 
AGTTTTAATA ATTTGCCCTT TCGACCAGGC CAAGTCTTCT CTTACCTACA AACCCAGTCT 
GTTCCCGAAC CAACATCAAT TGCAGGAATC TTACTTCTAG CCACAGTCAG TGCTGGTATG 
ATGGCGCGAC GTTCTCAGAA AAAAGTTTAG

Protein sequence

MLKIPNVQKL FSTAASLVSI TAIFCSQPVL AASFKPTPLI IDDDGSQDGM TALAYMLANP 
KFDVQAITIA QGIARPESFV NNLERMLGRL NASGIPVGIG RSTPLAGNNT FPEFIRTGAD 
TFWSPFVQLP DTAPPIVTRP AAELIVEKVK QSLAPVAILA TGSLTNIAEA LRLDPTIINN 
IAIIEIMGGA VFVPGNLPVL PDPPFSTNTT AEFNIWVDPL AAQEVFAAGG QGLKIQLTPL 
DATNQIAFSR ADQQAWLATA TPESKLAAEF LDFALTIIQS NNDPNPAWDL VAAINLSEPD 
FSVETPLYLE VDTTSDPGGT QGQTRAISNL PPNVLVSLNP SFNNLPFRPG QVFSYLQTQS 
VPEPTSIAGI LLLATVSAGM MARRSQKKV