Gene Ava_C0038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_C0038
Symbol
ID	3678114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007412
Strand	+
Start bp	59185
End bp	60336
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	45%
IMG OID	637715122
Product	hypothetical protein
Protein accession	YP_320316
Protein GI	75812699
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.818872
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGAAC ATCTTGTAAT TGCAACCGAC CCATTCTTCG GGCAAGACAT TTTAGAAAAT 
GCGTCAGCTG GAGCGCAATT AGTAGCAGAA GGTTTCAATG AACTTTGGCA AGAAACCCTC 
AACGGTAACT TGTACGGCTC CATGTGCAAA GTTGGTCAGT TTTTTGCGAT CGCTACACTC 
ACCCTTTTTA TGGTTGAGTT AGGCAAAAAC TGGATAAATC AAGAAGATAT GAAAGCTCTC 
TCCAGTTTGA TATGGCCCAT TCTGGTGATC GGACTACTAG CTAACAATGG CACTTTACTT 
AGAAGTGGAA CACTTGCCAT CCGGGGATAC ATTAATACTG TTAATAATGA CATCCTGGAA 
TTTACTGCTG CCGGAGCCAA CCTAGAAGTA GCATTCAACC GCGCAGTCGG CAATATTGCC 
CTCCAGCAGC AAGTAGGGGC GGCAATGGAA AGATGCCGCT CCATCCCTGG TAACACGCAA 
GATTCAATCA CCTGCTTGCA ACAAGCAGAA GCAGAACTCA AAACCTCTGC GCCCGATCTA 
TTTAAAGGAG AAGCCCCCGA TAGCGGTAGT TGGGAATTTA ACCCACTTCA GGCTTTATCT 
GATGCTAAAG ACGCGCTCGA AAATCTCTCC CCTGGTCAAA TCGCCGAAAA GATTGGTAAT 
ACTATCACCA GTACAATCGG TTCGATGATT ACTGGATTTG TCGCAGTTAT CCTCCTCGCC 
CTCAATAACG CTTACCAATG GGGTATAGAA TTCACGATGC TTTTAACTGC CCTACTTGGC 
CCGTTGGCAA TAGGCGGTTC GCTACTCCCC TTTGGCGCAA AACCTATTTT CGCTTGGCTA 
ACTGGTTATT TCACCGTTGG AATGGCGAAA CTCTGCTTCA ACATGATTAT TGGTTTGTGC 
GGACAACTTA TCGCTAATTC CGAACAAAAT CAACCGATGA TATTTCTGCT TTTTGTTGGG 
TTAGTTTCTC CTATCCTTGC ATCTGCATTA GCCGCAGGTG GTGGAATAGC TGTTTGGACA 
GGATTAGGTA AAACAGTAGC ATTTGGCTCT GAAATTGCAG CAGGAATCGC TACAGGTGGA 
GCAAGTACAA CTGCTACGGT TGCTGTCAAT GCCACCAAAT TTGTTAGTTC CAAAATCAAA 
GTTAAAAAGT AA

Protein sequence

MLEHLVIATD PFFGQDILEN ASAGAQLVAE GFNELWQETL NGNLYGSMCK VGQFFAIATL 
TLFMVELGKN WINQEDMKAL SSLIWPILVI GLLANNGTLL RSGTLAIRGY INTVNNDILE 
FTAAGANLEV AFNRAVGNIA LQQQVGAAME RCRSIPGNTQ DSITCLQQAE AELKTSAPDL 
FKGEAPDSGS WEFNPLQALS DAKDALENLS PGQIAEKIGN TITSTIGSMI TGFVAVILLA 
LNNAYQWGIE FTMLLTALLG PLAIGGSLLP FGAKPIFAWL TGYFTVGMAK LCFNMIIGLC 
GQLIANSEQN QPMIFLLFVG LVSPILASAL AAGGGIAVWT GLGKTVAFGS EIAAGIATGG 
ASTTATVAVN ATKFVSSKIK VKK