Gene Ava_2444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_2444
Symbol
ID	3683087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	3034506
End bp	3036407
Gene Length	1902 bp
Protein Length	633 aa
Translation table	11
GC content	44%
IMG OID	637717787
Product	FtsH peptidase
Protein accession	YP_322954
Protein GI	75908658
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000343724
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATT TTGGGAAAAA GGCATTGATA AAACAGCAAT CACCAAAGCG CGTTGCTTGG 
ACTGGTGCTT TGGCAGCCAG TTTGATTATG TTACCAACGA TGTTTGGCGG TAATCCTGTC 
TTAGCGCAAA AAGCAGAGCG TGAGTCTCTG TCATACGGAG AGTTGATTCA AAAAGTTAAT 
CAAGAGCAAG TCAAAAGAGT AGAACTGGAC GAAACTGAAC AGATAGCTAA AGTTTATTTA 
AAAGGGCAAA AACCAGACGC ACCACCAATA CAGGTGAGGT TGTTGGAGCA GAACAACGAG 
TTAATTAACA GACTCAAAGA AAAAAATGTT GATTTTGGTG AGATTTCTTC TGCCAATAGT 
AGAGCTGCTG TAGGGTTATT AATTAACCTG ATGTGGATTT TGCCATTGGT GGCTTTAATG 
CTGCTATTTC TGCGTCGTTC TACAAATGCT TCTAGCCAAG CAATGAATTT TGGCAAATCT 
AGGGCGCGTT TCCAAATGGA AGCCAAGACT GGGGTGAAGT TTGACGATGT AGCGGGTATT 
GAAGAAGCGA AGGAAGAATT ACAAGAAGTT GTGACATTCC TCAAGCAGCC AGAAAGATTT 
ACGGCTGTGG GTGCGCGGAT ACCTAAAGGT GTGCTGTTGG TGGGGCCTCC AGGTACTGGT 
AAAACTTTAC TAGCAAAAGC GATCGCTGGG GAAGCGGCTG TACCATTTTT CAGCATTTCC 
GGTTCGGAAT TTGTGGAAAT GTTCGTGGGT GTGGGTGCTT CTCGCGTCCG CGATTTGTTT 
AAGAAAGCTA AAGACAATGC GCCTTGTCTG ATATTTATCG ATGAAATCGA TGCAGTTGGC 
AGACAACGGG GTACGGGTAT TGGTGGGGGT AACGATGAGA GAGAACAAAC CCTCAATCAG 
TTACTCACGG AGATGGATGG TTTTGAAGGT AACACAGGCA TCATTATTAT TGCTGCAACC 
AACCGTCCCG ACGTATTAGA TTCAGCTTTG TTACGTCCTG GTCGTTTCGA CAGACAAGTA 
ATTGTTGATG CACCAGACTT GAAAGGACGC TTAGAGATTT TGCAAGTCCA TTCACGCAAT 
AAGAAAGTTG ACCCCAGTGT ATCACTAGAG GCGATCGCTC GTCGCACACC CGGATTTACA 
GGTGCAGATT TAGCCAACTT ACTCAACGAA GCCGCTATCC TCACAGCACG TAGACGCAAA 
GAAGCAATTA CGATTCTAGA AATTGATGAC GCTGTTGATA GGGTAGTTGC TGGGATGGAA 
GGGACACCCC TAGTAGACAG CAAGAGTAAG CGCTTAATTG CTTACCATGA AGTTGGACAT 
GGTTTAGTCG GGACGTTATT AAAAGACCAT GACCCAGTGC AGAAAGTCAC CCTGATTCCC 
AGAGGACAAG CACAAGGTTT AACTTGGTTT ACTCCCAACG AAGAACAAGG GTTAATCTCT 
CGTTCCCAAC TCAAAGCTAG AATTACTTCT ACTTTGGCCG GTCGTGCTGC TGAAGAAATT 
GTCTTTGGTA AGCCAGAAGT GACCACAGGT GCGGGTGATG ACCTGCAAAA AGTCACATCA 
ATGGCAAGGC AAATGGTGAC AAGGTTTGGT ATGTCTGAAC TAGGCCCCTT ATCTCTGGAA 
AATCAAAGTG GCGAGGTATT TTTAGGACGC GACTGGATGA ATAAATCCGA CTATTCTGAA 
GAAATAGCTG CCAAGATAGA TTCTCAAGTC CGAGAAATTA TCAACACCTG TTACCAAACA 
TCAAAGGAAC TTTTGCAAAC TAACCGCGTG GTTATGGAAC GACTAGTAGA TTTGTTGACA 
GAACAAGAAA CTATTGAAGG TGATTTGTTC CGTAAAATTG TTAGCGAAAG TCAAAACCAA 
GTGGTTGATG AGCAATTGTC GATGGTAATG GGTAATGGGT AA

Protein sequence

MKNFGKKALI KQQSPKRVAW TGALAASLIM LPTMFGGNPV LAQKAERESL SYGELIQKVN 
QEQVKRVELD ETEQIAKVYL KGQKPDAPPI QVRLLEQNNE LINRLKEKNV DFGEISSANS 
RAAVGLLINL MWILPLVALM LLFLRRSTNA SSQAMNFGKS RARFQMEAKT GVKFDDVAGI 
EEAKEELQEV VTFLKQPERF TAVGARIPKG VLLVGPPGTG KTLLAKAIAG EAAVPFFSIS 
GSEFVEMFVG VGASRVRDLF KKAKDNAPCL IFIDEIDAVG RQRGTGIGGG NDEREQTLNQ 
LLTEMDGFEG NTGIIIIAAT NRPDVLDSAL LRPGRFDRQV IVDAPDLKGR LEILQVHSRN 
KKVDPSVSLE AIARRTPGFT GADLANLLNE AAILTARRRK EAITILEIDD AVDRVVAGME 
GTPLVDSKSK RLIAYHEVGH GLVGTLLKDH DPVQKVTLIP RGQAQGLTWF TPNEEQGLIS 
RSQLKARITS TLAGRAAEEI VFGKPEVTTG AGDDLQKVTS MARQMVTRFG MSELGPLSLE 
NQSGEVFLGR DWMNKSDYSE EIAAKIDSQV REIINTCYQT SKELLQTNRV VMERLVDLLT 
EQETIEGDLF RKIVSESQNQ VVDEQLSMVM GNG