Gene Ava_3138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3138
Symbol
ID	3680772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	3900840
End bp	3902489
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	43%
IMG OID	637718487
Product	pseudouridine synthase
Protein accession	YP_323641
Protein GI	75909345
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTTTA CAGAGGTTCT ACACCCGTTG TCAGATTTTA TTGAATATGA TTTGACCGAT 
GATGACTTAT CAGCTAACTA TTGGTATGAA GGGTATTGTC TGCAATCTGG TGATTTATTA 
AGGCTGCCTC GTACTGCTTT AGTAGAGACG ATCGCTCATA GTTTAATGCA ATACCTTGCT 
AAGGATGAAC GTTATTCCCG TGAAGGTAAA ATGTATGGCA TATTGCTAGT TGAAATACCC 
ACGGGTGAAA GACGAGTACT TAAAGCTTTC TCTGGGTCGC TAAACGGACA AAATGTATTT 
GATGGCTGGG TTCCACCAAT TCCGGGAAGA GAACAAGTTG CTATACAAGA GGAGCATACT 
TTAGCTGAGT TAGATGCTAT TAAGCAGGAA TTGATTACCC TCAAGCAACT ACCACAAAGA 
CAAGAGTACG AAACTCTTTC TAGAGAGTTT GAGCAGCAGT TGCAAGCAAT GAGCGATCGC 
CATCGTTATC GCAAATCTCA ACGACAACAA CAACGTCAGC TAATAGACGA AACTATTTCA 
CCAGCAACCC TCACTACTAC TTTAGAACAG CTTGATGAAG AAAGTCGTCA GGATGGAATT 
GAACGACGGC GACTCAAGCA AGAACGAGAC ACAGTTCTGC AACCATTACA AGAAGCGATC 
GCCTCAGCAA ATATTAAAAT ACAACACCTC AAGCAAAAGC GGAAAGCCCT ATCTCGGCAA 
TTACAGGTGC AAATGCACGC TGCTTACTCC CTGATGAATT TTTTAGGGCA ATCTGTATCA 
TTACAGCAAT TGATGCCGAA TGGCTTACCT ACAGGAACGG GAGACTGTTG TGCGCCAAAA 
CTCTTACACT ATGCAGCCAC GCATGGACTG AAACCTTTAG CAATGGCTGA ATTTTGGTGG 
GGTTCATCCT GTCAAGATAA AATTCAGGGT GAGTTTTATG GCGCTTGCAT GGAACGTTGT 
CAGCCGTTGA TAGGATTTTT GTTGTCGGGT TTGAAACCTG ACTCAAACTT TGACAAAGAA 
CAAATTAATG TGATTTATGA GGACGAATGG CTGATTGCGG TGAACAAACC TGCGGGGTTG 
TTATCAGTTC CTGGTCGTTA TTTTGATACC CAAGATAGCG TTCTTAGCCG TTTGCGCCGT 
TTGTTAACTC AGGAAACAAT GCTTGCTGCT GTGCATCGCT TAGATCAAGA TACCTCTGGT 
ATTCTCTTAC TGGCAAGAGA CAGGCAAACT TATCGTCAAC TTAGCCAGCA GTTTCAACAG 
CGACAAGTTC ATAAGGTTTA TGAAGCCATA CTTGCCGGCG TTGTCAGCAC AGAGACTGGG 
ATAATTGATT TACCATTGTG GGGAGATCCA GAGAATCGAC CTTATCAGCA AGTTGATTGG 
CAACGTGGTA AACCTAGCGT GACAAACTTT CGGGCGATCG CCAGGGAAGG AGATTACACC 
CGCGTAGAAT TTGTACCACT CACCGGACGC ACCCATCAAT TAAGAGTTCA TGCGTCAGAT 
GTGCAAGGAT TGGGGGTGGT AATTTTGGGC GATCGCTTTT ATGGTTGCAC TGCTAAAGCA 
AATCGATTAC ATTTGCACGC TAGAGAACTC TGCTTTCTGC ATCCACACTC AGGAAAAATA 
ATTCACTTAC AAGTAAAGAC ACCATTTTAA

Protein sequence

MPFTEVLHPL SDFIEYDLTD DDLSANYWYE GYCLQSGDLL RLPRTALVET IAHSLMQYLA 
KDERYSREGK MYGILLVEIP TGERRVLKAF SGSLNGQNVF DGWVPPIPGR EQVAIQEEHT 
LAELDAIKQE LITLKQLPQR QEYETLSREF EQQLQAMSDR HRYRKSQRQQ QRQLIDETIS 
PATLTTTLEQ LDEESRQDGI ERRRLKQERD TVLQPLQEAI ASANIKIQHL KQKRKALSRQ 
LQVQMHAAYS LMNFLGQSVS LQQLMPNGLP TGTGDCCAPK LLHYAATHGL KPLAMAEFWW 
GSSCQDKIQG EFYGACMERC QPLIGFLLSG LKPDSNFDKE QINVIYEDEW LIAVNKPAGL 
LSVPGRYFDT QDSVLSRLRR LLTQETMLAA VHRLDQDTSG ILLLARDRQT YRQLSQQFQQ 
RQVHKVYEAI LAGVVSTETG IIDLPLWGDP ENRPYQQVDW QRGKPSVTNF RAIAREGDYT 
RVEFVPLTGR THQLRVHASD VQGLGVVILG DRFYGCTAKA NRLHLHAREL CFLHPHSGKI 
IHLQVKTPF