Gene Ava_1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1072
Symbol
ID	3678585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	1302404
End bp	1303654
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	43%
IMG OID	637716408
Product	hypothetical protein
Protein accession	YP_321591
Protein GI	75907295
COG category	[S] Function unknown
COG ID	[COG1649] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0972168
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTGT TTGTGAAGTG GTGTAGTGGA TCTTTATTAC CTAATGTTGC GGCAATTAGA 
AAGCAAGTCT TCTTTGCCTT AATGATGGTT TTGAGTGTTG TGGCTACGGT GATGCTATCG 
TTTCCCTTAA AGGCTCAAAT TACTCCTAGT GCAGGATTAG CATCTGAATT GAGGGGGGTA 
TGGTTAACCA ATATTGATAG TGATGTATTA TTTGAACGCG ATCGCCTCAA AACATCTTTA 
CAAAGTCTAG ATAAACTCAA CTTCAATACC GTATATCCAG CAGTGTGGAA CTGGGGACAT 
ACACTTTACC CCAGCAAAGT TGCAGCCAAA GTTATTGGAC GAGCGATCGA CCCGACCCCA 
GGATTACAGG GGCGAGATAT GCTCAAAGAA ATCGTCACAG AAGGACATAA ACAAGGATTA 
ACCGTAATTC CCTGGTTTGA ATTTGGGTTC ATGGCTCCAG CCGATTCTCT CCTCGCCAAA 
AACCGTCCCC AATGGTTAAC CAGTCGTAGC AACGGTAGTC GCATAGTCAA GGAAGGCATA 
CACGATCGCG TGTGGTTAAA TCCCTTCCGC CCAGATGTCC AACAATTTAT CCAAGATTTA 
ATCGTGGAAA TTGTAAGAAA CTACGACATC GATGGTATTC AATTTGACGA TCATTTCGGC 
TTACCTTCAG AACTAGGCTA CGATGCCTAC ACAGTAGCTT TATACAAGAA AGAACACCGT 
GGTCAAGCCC CCTCCAAAAA CCCCCGTGAT CCGGAATGGC TACGCTGGAG AGCCAGTAAA 
ATTACCAACT TCATGCAAAG AGTATTTAAA GCAATTAAAG CCACTAAAAA AGATTGCTTG 
GTTTCCGTTG CACCTAATCC TCAGCGTTTC TCCTATGATT ACTTTTTAGC AGATTGGCAG 
AAATGGGAAA GAATGGGACT GATTGAAGAA CTGGTATTGC AAATTTACCG GGATGATTTA 
AACGTTTTTG TTCAAGAATT AGAATATCCA GAAGTCAAAA CAGCCAAAGC ACATATCCCT 
GTGAGTATCG GCATTTTATC TGGGTTGAAA AATCGCTCCG TACCCATACA ACAGATTCAA 
ACCCAAGTGC AGAAAGTACG CGATCGCAAC TTTGCCGGCG TTTCTTTCTT CTTCTACGAA 
ACCCTATGGA ATCTCAGCCA GGAAGCATCT GCAAAACGCC AGGCTGGCTT CCAACAAATA 
TTCTCCCAAC CTGCCAAATA TCCCAATCTG ATCACAGGTT GGAAACCATA G

Protein sequence

MKVFVKWCSG SLLPNVAAIR KQVFFALMMV LSVVATVMLS FPLKAQITPS AGLASELRGV 
WLTNIDSDVL FERDRLKTSL QSLDKLNFNT VYPAVWNWGH TLYPSKVAAK VIGRAIDPTP 
GLQGRDMLKE IVTEGHKQGL TVIPWFEFGF MAPADSLLAK NRPQWLTSRS NGSRIVKEGI 
HDRVWLNPFR PDVQQFIQDL IVEIVRNYDI DGIQFDDHFG LPSELGYDAY TVALYKKEHR 
GQAPSKNPRD PEWLRWRASK ITNFMQRVFK AIKATKKDCL VSVAPNPQRF SYDYFLADWQ 
KWERMGLIEE LVLQIYRDDL NVFVQELEYP EVKTAKAHIP VSIGILSGLK NRSVPIQQIQ 
TQVQKVRDRN FAGVSFFFYE TLWNLSQEAS AKRQAGFQQI FSQPAKYPNL ITGWKP