Gene Nmag_0333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_0333
Symbol
ID	8823154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	323945
End bp	325066
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	66%
IMG OID
Product	gas vesicle protein GvpN
Protein accession	YP_003478485
Protein GI	289580019
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGAGG ACACCTCGCG CAAGCGCAAA GTCCGTGGCA GAAAGATTCG CGGTGACCGG 
GAGGCGAAGA AGCGCCTCAA GGCCCGAAAG AAGCTGGCTC GATCGGCATC GCAGACGAAG 
ACAAAGAGCG AAACAGCCAG CAAATCGAGG GGCTCTCACA TCGCAACCGA GAGCGGAGAT 
GACCACCTCA TAGACCCCGC CGACGCTGCA CCGGACCCCT TCGTCGAAAC CGACGCCGTC 
GCTGCCGTTC GCGACCGGAT CACCGGGTGG CTCGCTGCCG ATCAGCCGGT TCACCTGATC 
GGCCCGACCG GCGCTGGTAA GACGGCACTC GCACTGGCAG CGGCTGCAAC GCGCGGCCGC 
CCGGTCGTCC TCTGCAACGG CGACGAGGCG GTCGACACGA GCGCGCTCGT CGGCGGCTAC 
AGCGGCGGCG AACGCTACGA GGAGCGCGAC GAGTACGTCA GCGGCGTCAG CAAGAAGACA 
CAGATCGTCC GCGACCGCTG GGTCGACAAC CCGCTCTCCG TCGCGGTCCG AGAGGGCGCA 
ACGCTCGTCT ACAACGAGTT CTCCCGGAGC GACCCCGCCG CCCACAACGT CTTGCTCTCC 
GTCCTCGAGG AAGGTGTACT CGAGCGGCCG GGCAAGCACG GGGCCAATAG GTCGATCGAC 
GTGCATCCGG AGTTCCGCGT GATCTTCACG TCGAACGACG TGGAGTACGC GGGTGTCCAC 
CAGCAACAGG ATGCACTGCT CGACCGGATG GTCGGCGTGC ACGTCGACTA CTACGACGCA 
GAGACCGAGC GCGAAATCGT GCGGTCGCAC GTGGCCGTTT CCGACGAAGC GATCGAAACG 
GTCGTCGACG CGACCCGGAC GCTGCGCGAG GAACTCCCGG TCGTCGTCGG GACGCGGACA 
GCGATTACGG CCGCGAAGGG GATCTCGGTG TTCGACGACT GGAATGGTGA CGAGGCTGCA 
CCCGAGCGGG CAGACGGCGG TCGGGTACAG GTCGACGGCG ATGACGACCT GCTCGCAGAC 
GTGTTGACGG ATGTGCTCGG CCCGAAAGTC GCTGGAGCAG AGACGGAAAT CGATGGGATG 
GCCGCCCTGC ACAGTCAGAT TAGCGAGGTA CTTCGGGACT GA

Protein sequence

MAEDTSRKRK VRGRKIRGDR EAKKRLKARK KLARSASQTK TKSETASKSR GSHIATESGD 
DHLIDPADAA PDPFVETDAV AAVRDRITGW LAADQPVHLI GPTGAGKTAL ALAAAATRGR 
PVVLCNGDEA VDTSALVGGY SGGERYEERD EYVSGVSKKT QIVRDRWVDN PLSVAVREGA 
TLVYNEFSRS DPAAHNVLLS VLEEGVLERP GKHGANRSID VHPEFRVIFT SNDVEYAGVH 
QQQDALLDRM VGVHVDYYDA ETEREIVRSH VAVSDEAIET VVDATRTLRE ELPVVVGTRT 
AITAAKGISV FDDWNGDEAA PERADGGRVQ VDGDDDLLAD VLTDVLGPKV AGAETEIDGM 
AALHSQISEV LRD