Gene Ava_4857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4857
Symbol
ID	3679277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	6120266
End bp	6121852
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	40%
IMG OID	637720214
Product	phospholipase D/transphosphatidylase
Protein accession	YP_325349
Protein GI	75911053
COG category	[I] Lipid transport and metabolism [L] Replication, recombination and repair
COG ID	[COG1502] Phosphatidylserine/phosphatidylglycerophosphate/cardiolipin synthases and related enzymes [COG1555] DNA uptake protein and related DNA-binding proteins
TIGRFAM ID	[TIGR00426] competence protein ComEA helix-hairpin-helix repeat region

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.404738
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000312959
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGATAGTGG CGATCGCCGC CTGTCAAAAA GTCCAATCTC ACAATAATCG TCCTGCACCT 
CTACCGCAAG ACTCATTTGT GAAAGTTTAC TTTAATCAAT CCGAATCCTC AGAATATCGA 
GAACCTTACC GTCAACAAAC TCGACTGGGA GATAACTTAG AACAGCAGAT TATTGACGCT 
ATTTCTCAAG CTAAATCTAC TATCGATGTA GCAGTACAAG AATTGCGTTT ACCGAGAATC 
GCCCAAGCCC TCAAAGACAA ACAAAAAGCG GGAATCAAAG TCAGAGTAAT TTTAGAAAAT 
ACCTATACTC GTTCTTTGAG TAACTTGACA CCAGATGAAG TCAAGAAATT ACCTGAACGG 
GAACAAGCAC GCTATCAAGA ATACTTTAAA TTTGTAGACC TAAACCAAGA TAATCAACTC 
AGTCCTGAGG AAGTTAATCA GAGGGATGCA CTGATAATTT TACAAAATGC CAAAATTCCT 
TGGATAGATG ATCAAGCTGA TGGTTCAGCA GGTAGTAAGT TGATGCACCA TAAGTTTGTG 
GTTGTAGATA ATCGCATAGT AATTGTGACT TCGGCAAACT TCACCTTAAG CGACGTTTTC 
GGGGATTTCT CTAATTCTTC AAGTTTGGGA AATGCCAACA ACCTATTACA CATTGATAGC 
CCAGAATTAG CAGCTTTGGT CACAGAAGAA TTCAACCTCA TGTGGGGTGA TGGTGTTGGA 
GGTAAACCAG ACAGTAAATT CGGTTTAAAT AAACCTGTAC GTCCTCCCCA AAAAATTACC 
TTGGGTGACA ACACAATTAC TGTGCATTTT TCCCCAACTT CACCCACCTT ACCTTGGACT 
CAAAGCAGCA ATGGCTTAAT TAATGAAAGC TTAAATTTAG CGAATAAATC TATTGATATG 
GCGTTGTTTG TTTTTTCCGA ACAGCGTCTT GCTAATACAT TAGAAAAACG TCATCAACAA 
CAAGTCTCAA TTCGAGCATT AATTGATAAA CAATTCGCCT ATCGTTATTA CAGCGAAGCT 
TTAGATATGA TGGGAATTGC CCTGGGTAAT AAATGCCGAT ATGAAATTGA TAATCGACCT 
TGGTCTAATC CCGTTACTAC GGTGGGCGTA CCCACTTTAC GAGAAGGAGA CCTGCTACAC 
CATAAATTTT CTGTTATCGA CAACCAAACG GTAATTACAG GTTCTCACAA CTGGTCTGAT 
GCAGCAAATC ATGGCAATGA TGAGACTTTG ATAGTAATTA ATAATCCCAC AATTGCTGCT 
CATTATGAGC GTGAATTTGC TCGTCTTTAC GCTAAAGCTC AAGTCGGTGT CCCAGCCAAA 
GTCCAAGCAC AAATTCAACA AGAACAAAAG CAATGTGGTC AAATTAAAAC TCCTACTTCC 
AGTGAACTTA CTCCTACTCA AGTGGTGAAT ATCAATACAG CAAATTTGGC AGAATTGGAG 
ACCTTACCCG GTGTAGGTAA AAAGCTAGCC CAAAAAATTA TCACCGCCCG TCAGCAGAGA 
AAATTTGTCT CATCACAAGA CTTGGATAAA GTACCTGGAA TCAGTCCAAA GATGATAGAA 
AATTGGCAAG GGCGTATTCA ATTTTAG

Protein sequence

MIVAIAACQK VQSHNNRPAP LPQDSFVKVY FNQSESSEYR EPYRQQTRLG DNLEQQIIDA 
ISQAKSTIDV AVQELRLPRI AQALKDKQKA GIKVRVILEN TYTRSLSNLT PDEVKKLPER 
EQARYQEYFK FVDLNQDNQL SPEEVNQRDA LIILQNAKIP WIDDQADGSA GSKLMHHKFV 
VVDNRIVIVT SANFTLSDVF GDFSNSSSLG NANNLLHIDS PELAALVTEE FNLMWGDGVG 
GKPDSKFGLN KPVRPPQKIT LGDNTITVHF SPTSPTLPWT QSSNGLINES LNLANKSIDM 
ALFVFSEQRL ANTLEKRHQQ QVSIRALIDK QFAYRYYSEA LDMMGIALGN KCRYEIDNRP 
WSNPVTTVGV PTLREGDLLH HKFSVIDNQT VITGSHNWSD AANHGNDETL IVINNPTIAA 
HYEREFARLY AKAQVGVPAK VQAQIQQEQK QCGQIKTPTS SELTPTQVVN INTANLAELE 
TLPGVGKKLA QKIITARQQR KFVSSQDLDK VPGISPKMIE NWQGRIQF