Gene Ava_5056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_5056
Symbol
ID	3683538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	6349781
End bp	6351202
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	38%
IMG OID	637720417
Product	Phage integrase
Protein accession	YP_325548
Protein GI	75911252
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.343108
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAACG GTGCAAAAAC ACCCACAGGT AAGGCTAAGA AGGGTCAAGT AGTTGTCAGG 
ATAGACTCTA GTAGCGTTAA GGCTTGCTTC CCTCGGAGTT ACTTTGCAGA TGGTAAGCAA 
ATAAAGCTAG GGACAGGCAT TAACCCAGAT GACTGGGAAG CTACAGCCGC AAAATTACAG 
CGTCGGTTAC AACTTGAGTT AGAAGATGGG AAGTTATCTA CCAATGAGGG CATATTCAAT 
TTAGGTAGAT ACCAGGAAAT ACTTGAAGAA TATGGTTTAA GAGCAAAACT CAGATTAGTT 
AGAGATGTTT CCGCGACAAG TAGCAGTGAC GAGATACCAC CTAAACCCCA GTTATCGCTA 
CTAGAAGTCT GGGATATGTA TTGTGAGTAC AGAAAACCAG GATTGAGGGA GAGTACGTAT 
AAAAATTTAT ATCAAACGCT TTATCGTAAT TTTATTAAAT TAGCAATAGA AGCTACAAAG 
AGTGAAGATG CTTTAAAAAT CAGGAATTGG TTGATAGAAA ATAGGAACAC TAAATCAACT 
AAGCAGATTT TAATTAATCT CTCAAAAGCC TATCAATTAG GCATAAAAAA CAAGCTATTG 
ACCCATAATC CCTATGACGG TCTAGCCGAC GAGATAACCA CTAAAGGCGC TAAAGGGAAA 
AAACAAAATG AAGTAAGCAG CGATAATGAT GTGCTTGACC AATCAAAAGC CTACACCTGG 
GATGAAGTAC AAGCAATACT TGATTTAGTG AAGTACGAAT ACACCCATTA TTATAATTTC 
ATTAAATTCA AATTCCTTAC AGGATGTAGA ACTGGTGAAG CTGTAGCGTT TATGTGGTGC 
GATATTGAGT GGGACAAAGA GAGGATTTTA ATTCGTAGAA CTTATGAACC TAGAACACGT 
AAGTTTTATC CATTGAAAAA TGATAGTAGT TACAAGGGTG AATTAATTCG CAGGTTTCCG 
ATCATTAGAG ACGGTGAGCT ATGGAAGCTA TTACAATCAA TTCCTGAAGG TCAAGATAAT 
GATGTGGTGT TCACAACCAA AAACGGAAAA ATTATTAATG ATGCTAATTT TGGGCATATT 
TGGCGAGGAA CACACAATCA ACAAGGAATA ATCCCTCAGT TAATAGAACA AGGCAAACTC 
TCAAAGTATC TTTCACCTTA CAACACACGC CATACATTCA TTACACATCA AGTATTTGAT 
TTAGGACAAG ATGAAAAAAT AGTTGCTAAA TGGTGTGGAC ACAACATCGA CGTCAGCAAT 
AAGCATTACC AAGACGTGGC TATCTTCGCA GAGAAAACTA ATCCCGATTT GCCAGCTAAC 
CAACAATCAA TACAACAAAC AGAGTTAGAT ATCCTGAAAG AACAGTTAAG GCAACAACAG 
GAGTTAATCA ATAAATTACT AGCTGAGAAA GAGACTAAAT AG

Protein sequence

MVNGAKTPTG KAKKGQVVVR IDSSSVKACF PRSYFADGKQ IKLGTGINPD DWEATAAKLQ 
RRLQLELEDG KLSTNEGIFN LGRYQEILEE YGLRAKLRLV RDVSATSSSD EIPPKPQLSL 
LEVWDMYCEY RKPGLRESTY KNLYQTLYRN FIKLAIEATK SEDALKIRNW LIENRNTKST 
KQILINLSKA YQLGIKNKLL THNPYDGLAD EITTKGAKGK KQNEVSSDND VLDQSKAYTW 
DEVQAILDLV KYEYTHYYNF IKFKFLTGCR TGEAVAFMWC DIEWDKERIL IRRTYEPRTR 
KFYPLKNDSS YKGELIRRFP IIRDGELWKL LQSIPEGQDN DVVFTTKNGK IINDANFGHI 
WRGTHNQQGI IPQLIEQGKL SKYLSPYNTR HTFITHQVFD LGQDEKIVAK WCGHNIDVSN 
KHYQDVAIFA EKTNPDLPAN QQSIQQTELD ILKEQLRQQQ ELINKLLAEK ETK