Gene Ava_0645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0645
Symbol
ID	3678674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	813122
End bp	814174
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	46%
IMG OID	637715973
Product	dihydrouridine synthase TIM-barrel protein nifR3
Protein accession	YP_321164
Protein GI	75906868
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.446085
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.634764
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTACTC TGTCCCCCAA CCTCAAAGCT AGACTTTCCC AACCCCTAAA CATCGGCTCG 
TTTGTAGTTA AAAGCCGTGT TCTTCAGTCG CCTTTGTCGG GGGTGACAGA TATGGTGTTT 
CGCCGTCTAG TACGTCGCTA TGCACCCGAT TCGATGATGT ATACAGAAAT GGTGAATGCT 
ACGGGTTTAC ACTACGTCCA GCAGTTACCA AAAATTATGG AAGTAGACCC CAACGAGCGA 
CCAATCAGTA TTCAGTTGTT TGACTGTCGT CCCGATTTTT TGGCAGAAGC AGCAATCAAA 
GCCGTTGCGG AAGGCGCTGA TACGATTGAT ATCAATATGG GGTGTCCGGT AAATAAAATT 
ACCAAAAACG GCGGAGGTTC TTCTTTACTA CGACAGCCGG AAGTTGCAGA AGCCATTGTA 
CGGGAAGTAG TAAAAGCTGT TAATGTGCCG GTCACTGTCA AAACCCGGAT TGGCTGGAAT 
GACAGAGAAA TTACCATTCT CGATTTTGCC AAGCGCATGG AAGACGCTGG AGCGCAAATG 
ATTACGGTGC ATGGACGTAC CCGCGCTCAA GGTTACAATG GCAATGCCCG TTGGGAATGG 
ATAGCCCGTG TCAAAGAAAT ACTTTCCATC CCCGTGATTG GTAATGGCGA TATATTTTCC 
GTAGAATCGG CGGTGAAATG TTTAGAAGAA ACGGGTGCTG ATGGTGTGAT GTGTTCCCGT 
GGGACTTTAG GTTATCCGTT TTTGGTGGGG GAAATTGACC ATTTCTTAAA GACTGGTGAA 
CTCCTGACAG CACCAACCCC AATTCAACGT TTGGAATGTG CTAGAGATCA CTTACAAGCC 
TTATGGGAAT ATAAAGGCGA TCGCGGTGTC CGTCAAGCCC GCAAGCACAT GACTTGGTAT 
GCTAAAGGTT TTGTCGGTGC GGCTGAGTTG CGTGGACAAT TAAGCGTAAT TGAAACAGTC 
CAACAAGGTT TAGATTTGAT TGACAAAGCC ACTGAAAAGC TAACTCATGG TTATGAGCTA 
GTGGAGGAAG CTGATAATTT TCAGGTAGCT TAA

Protein sequence

MVTLSPNLKA RLSQPLNIGS FVVKSRVLQS PLSGVTDMVF RRLVRRYAPD SMMYTEMVNA 
TGLHYVQQLP KIMEVDPNER PISIQLFDCR PDFLAEAAIK AVAEGADTID INMGCPVNKI 
TKNGGGSSLL RQPEVAEAIV REVVKAVNVP VTVKTRIGWN DREITILDFA KRMEDAGAQM 
ITVHGRTRAQ GYNGNARWEW IARVKEILSI PVIGNGDIFS VESAVKCLEE TGADGVMCSR 
GTLGYPFLVG EIDHFLKTGE LLTAPTPIQR LECARDHLQA LWEYKGDRGV RQARKHMTWY 
AKGFVGAAEL RGQLSVIETV QQGLDLIDKA TEKLTHGYEL VEEADNFQVA