Gene Ava_4078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4078
Symbol
ID	3681601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5067276
End bp	5068466
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	44%
IMG OID	637719429
Product	YeeE/YedE
Protein accession	YP_324577
Protein GI	75910281
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.38818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAATG GGGTTGAGAA TACGTTGACA TCTAAATCTC AGTTATTACC TCCCAGACCA 
CAAAAATTAG TTGTGGCGAT CGCATTATTT ATCTTTACAG TCGGATCTGT TTTATTGAGT 
AAATATGGCT GGCGACAAAG TGTATTATTC CTCATCGGTG GTTTGTTGGG TGTGAGCCTT 
TATAATTCTA GTTTTGGCTT TGCCTCTGCT TATCGCAAAC TGCTGTTGAA TAGAGATGTG 
CGGGGAATAT ATGCTCAGTT AGTAATGCTA GCGATCGCTA CTGTGTTATT TGCGCCAGTG 
TTAGCTGCTG GTAAGGCTTT CGGTCAAGAA GTAGCAGGAG CGATCGCACC TGTGAGTATA 
TCAGGGGCGA TTGGTGCATT CATCTTTGGA ATCGGAATGC AATTAGGTGG AGCTTGTGGT 
TGCGGTACAC TCTACACCAT TGGCGGAGGT AGTTACACCA TGCTCATTAC CCTGATCACC 
TTTTGTTTAG GCGCATTCTG GGCTAGTTTG ACTAGATATC TTTGGGCTGG TTTGCCAAAA 
GCCGAACCAA TTGTTTTAGG TGAAACTCTC GGTTGGACAG GTGCAGTAGT CTTACAGTTG 
GGTATATTGT TGCTGTTAGC TGGGGGGCTT TGGTTGTGGA GTAAAAACAG CAAATCAGCA 
TCAGCAGAAC ATCCCTCACC CACACGCTCA GGATTTTTAT TTGGCTCTTG GTCAGTATTT 
ACAGGTGCGA TCGCCTTAGC TGTACTTAAT TGGTTAACCC TGCTTATTTC TGGCGAACCT 
TGGCGAATTA CCTGGGGGTT TGCTCTATGG ACAGCAAAAA TAGCCACCAT GTTCGGCTGG 
AATTCCTCCA CGAGTAAATT TTGGGATGGT GATACAGCAT TATCAAATAG TGTGTTTGCA 
GATGTCACCT CCGTGATGAA TCTAGGTATT ATCTTAGGTG CATTATTAGC AGCCGCCTTA 
GCAGGAAAAC TCACACCACA AACTCAAGTT AGCCCATCAA AAATTCTTGC TACGGTGATT 
GGTGGATTAA TTATGGGTTA TGGTGCTTTT ACAGCTTTCG GGTGTAATGT CAGTGCCTTT 
TTTAGTGGTA TTGCTTCCAC TAGCATACAT GGTTGGGTTT GGATTGTTTG CGCTTTATTA 
GGAACGGCAA TTGGTATTAA ACTGCGTCCT CTGTTCAGTT TGCCAAATTA G

Protein sequence

MSNGVENTLT SKSQLLPPRP QKLVVAIALF IFTVGSVLLS KYGWRQSVLF LIGGLLGVSL 
YNSSFGFASA YRKLLLNRDV RGIYAQLVML AIATVLFAPV LAAGKAFGQE VAGAIAPVSI 
SGAIGAFIFG IGMQLGGACG CGTLYTIGGG SYTMLITLIT FCLGAFWASL TRYLWAGLPK 
AEPIVLGETL GWTGAVVLQL GILLLLAGGL WLWSKNSKSA SAEHPSPTRS GFLFGSWSVF 
TGAIALAVLN WLTLLISGEP WRITWGFALW TAKIATMFGW NSSTSKFWDG DTALSNSVFA 
DVTSVMNLGI ILGALLAAAL AGKLTPQTQV SPSKILATVI GGLIMGYGAF TAFGCNVSAF 
FSGIASTSIH GWVWIVCALL GTAIGIKLRP LFSLPN