Gene Nmag_3843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_3843
Symbol
ID	8826713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013923
Strand	-
Start bp	232609
End bp	233913
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	59%
IMG OID
Product	Glycosyltransferase 28 domain protein
Protein accession	YP_003481946
Protein GI	289583536
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACG ACAAGACGAT CGCGTTTTTC CCGGAAGCGG CATACGGGCC AGCACTAAAT 
TCCGTCGGCA TCGCACAGGA GTGTCGCGAA CTCGGCCACG AACCCGTCTT CCTCACCGAT 
CCACCAATGG CGGAGGTCTT CGAAGACCAC GGCTTCGAGA CGTACGAGGT CAACATGGCG 
GATCCGTCAC TGACGGCTGA GGAGAAATCG AAGTACTGGG ACGACTTCAT CAACAAGCAC 
ATCCCGAACT TCGATAAGGA GCCCTACGAC CAGCTCGACA ACTACATCAC GGAGTGCTGG 
GACGCCATCG TCGAAACCGC GAAGTGGGCA CAGCAGGACT TACCGGACGT ACTGGACGAA 
GTCGACCCGG ATCTGATCTG CGTCGACAAC GTCGTTCTGT TCCCGGCTAT CAAACAGTAC 
GGCGTCCCCT GGGTTCGAAT CGTCTCCTGC GCAGAAAACG AGATTCCAGA CCCCAATATT 
CCGCCGTACC TGTCGGGCTG TCGCGCGGAC GATGTCGAGA GCCACCACGA GTTCGAGCGC 
CGGTACGACG AACTGATCGC GCCGGTCCAC GACGACTTCA ACGACTTCCT CAGAGAACAC 
GGCGAAGAGC CGTATCCGCA CGGGCTGTTC TTCGAGACGT CCCCATACCT CAACCTCCTC 
AAATACCCCG AACGACTGCG CTGGGACCGC TGGAACGAAC TCGACCCAGA CCGGTTCCAG 
TACCTGAACG GCTGTCTTCG AGACGAGGAC GAAACCTACG AGGTCCCACC GATCGGCGAC 
GAGGACGATC CGCTCGTCTA CCTGAGCTAC GGCAGCCTCG GCTCGGGCGA TACGGACCTG 
CTGAAGCGCC TCCTCGAGTT CTTCGGCAGC CAGCCCTACC GCTTCCTCGT GAACGTCGGC 
GAATACATCG ACGAGTACGA CGACACACAG ATTCCGGACA ACGTCAAAAT CGATAGCTGG 
TTCCCCCAGC AGTCGGCCAT CTCGCAGGCT GACGTCGTTA TTCACCACGG CGGGAACAAC 
ACGTTCAACG AGTGTCTCTA CTACGGCAAA CCGGCGATCA TTATGCCGTA CGTCTGGGAC 
GGACAGGACA ACGCCACTCG ACTCGACGAG ACGAATCACG GCATCAAACT TCACCGCTCT 
GACTGGACGC CCGAGGAATT CGCCGAGGCA CTCGAGACCT GCCTGACTGA CGAGGAGATC 
CAGGCGAACG TCGCACAGAC CTCGGCCGAC ATGCAGGCAC AGAGCGGAAC AGAAAAGGCA 
GCGCGGCTGC TCGATGACGT ACTGGAGGAT CACGATAATG TCTGA

Protein sequence

MSDDKTIAFF PEAAYGPALN SVGIAQECRE LGHEPVFLTD PPMAEVFEDH GFETYEVNMA 
DPSLTAEEKS KYWDDFINKH IPNFDKEPYD QLDNYITECW DAIVETAKWA QQDLPDVLDE 
VDPDLICVDN VVLFPAIKQY GVPWVRIVSC AENEIPDPNI PPYLSGCRAD DVESHHEFER 
RYDELIAPVH DDFNDFLREH GEEPYPHGLF FETSPYLNLL KYPERLRWDR WNELDPDRFQ 
YLNGCLRDED ETYEVPPIGD EDDPLVYLSY GSLGSGDTDL LKRLLEFFGS QPYRFLVNVG 
EYIDEYDDTQ IPDNVKIDSW FPQQSAISQA DVVIHHGGNN TFNECLYYGK PAIIMPYVWD 
GQDNATRLDE TNHGIKLHRS DWTPEEFAEA LETCLTDEEI QANVAQTSAD MQAQSGTEKA 
ARLLDDVLED HDNV