Gene Ava_4248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4248
Symbol
ID	3680896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5327904
End bp	5329379
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	48%
IMG OID	637719596
Product	nitrogenase molybdenum-iron protein alpha chain
Protein accession	YP_324742
Protein GI	75910446
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01282] nitrogenase molybdenum-iron protein alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCTA CCGAATCTTT AAACGAAACA ACGCCAGTCG TTGATAAAAA AGAACTTATT 
CAAGATGTGC TACAAGCCTA TCCCGAAAAA TCACGTAAAA GACGGGAAAA GCACCTCAAC 
GTTTACGAAG AAGGCAAATC AGATTGCGGC GTTAAATCCA ACATCAAATC AGTTCCCGGT 
ACAATGACCA CCCGTGGTTG CGCCTATGCA GGTTCTAAAG GTGTGGTTTG GGGGCCAATC 
AAGGACATGA TCCACATCAG TCACGGCCCG GTCGGTTGCG GTTACTACTC CTGGTCTGGT 
CGTCGTAACT ATTATATCGG TACTACTGGT ATCGATACCT TCGGCACAAT GCAGTTTACC 
TCCGATTTCC AAGAACGGGA CATCGTATTT GGTGGAGATA AAAAACTCGC CAAACTCATC 
GATGAAATTG AAGAACTATT CCCCCTCAAT CGTGGTATTT CCATACAATC CGAATGTCCC 
ATCGGTTTAA TTGGAGACGA CATCGAAGCC GTTGCCAAGA AGAAAACCAA AGATACTGGC 
AAAACCGTTG TTCCTGTACG TTGCGAAGGC TTCCGGGGTG TGTCTCAGTC CCTGGGACAC 
CACATTGCTA ACGACACCAT CCGCGACTGG GTATTCCCCA AAGCCGACAA AGCCAAGAAA 
GAAGGCACAC TCGGATTTGA ACCAGGCCCT TACGATGTAG CAATCATCGG TGATTACAAC 
ATCGGCGGTG ATGCTTGGTC TAGTCGCATC CTCTTAGAAG AAATCGGGTT GCGCGTTGTA 
GCGCAGTGGT CTGGCGACGG CACACTTCAT GAGATGATGC TTACCCCCAG CGTGAAACTG 
AACTTAGTTC ACTGCTATCG CTCCATGAAC TACATCGCCC GCCACATGGA AGAAACCTAT 
GGTATTCCGT GGTTAGAATA CAACTTCTTC GGCCCCACTC AAATTGCTAA GTCATTACGA 
GAAATTGCAG CCAAGTTTGA CGAAACCATT CAAGCAAAAA CAGAAGAAGT CATCGCTAAG 
TATGAAGCCC AAACCAAGGC TGTGCTTGAC AAGTACCGCT CCCGCTTAGA AGGAAAAACC 
GTTGCACTCA TGGTTGGTGG TCTACGTCCT CGCCACGTTG TACCAGCATT TGAAGACCTG 
GGTATGAAGC TAATTGGTAC AGGATATGAA TTTGGTCACA ACGACGACTA CAAACGCACT 
ACCCACTACG TAGAAAACGG CACTCTGATT TACGATGACG TATCTGCTTA TGAGTTCGAG 
CAGTTCGTTA AAGCACTCAA GCCCGATTTA ATTGCCTCTG GTATTAAAGA GAAGTACGTC 
TTCCAAAAAA TGGCGCTTCC CTTCCGGCAA ATGCACTCAT GGGATTATTC CGGGCCATAC 
CACGGCTACG ACGGATTCGC CATCTTCGCC CGTGACATGG ATCTAGCTCT CAACAGCCCC 
ACCTGGAGTT TGATTGGCGC TCCTTGGAAG AAGTAA

Protein sequence

MSPTESLNET TPVVDKKELI QDVLQAYPEK SRKRREKHLN VYEEGKSDCG VKSNIKSVPG 
TMTTRGCAYA GSKGVVWGPI KDMIHISHGP VGCGYYSWSG RRNYYIGTTG IDTFGTMQFT 
SDFQERDIVF GGDKKLAKLI DEIEELFPLN RGISIQSECP IGLIGDDIEA VAKKKTKDTG 
KTVVPVRCEG FRGVSQSLGH HIANDTIRDW VFPKADKAKK EGTLGFEPGP YDVAIIGDYN 
IGGDAWSSRI LLEEIGLRVV AQWSGDGTLH EMMLTPSVKL NLVHCYRSMN YIARHMEETY 
GIPWLEYNFF GPTQIAKSLR EIAAKFDETI QAKTEEVIAK YEAQTKAVLD KYRSRLEGKT 
VALMVGGLRP RHVVPAFEDL GMKLIGTGYE FGHNDDYKRT THYVENGTLI YDDVSAYEFE 
QFVKALKPDL IASGIKEKYV FQKMALPFRQ MHSWDYSGPY HGYDGFAIFA RDMDLALNSP 
TWSLIGAPWK K