Gene Apre_1444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1444
Symbol
ID	8398254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	1562883
End bp	1563893
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	42%
IMG OID	644995809
Product	asparagine synthetase AsnA
Protein accession	YP_003153188
Protein GI	257066932
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2502] Asparagine synthetase A
TIGRFAM ID	[TIGR00669] aspartate--ammonia ligase, AsnA-type

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGT TAGTTATACC AGAAAATTAT AAAAGCAATG AAGATTTATA TAGAACCCAA 
CTGTTGATCA AGGAAATCAA AGACTATTTC CAAATCAACC TAGCCAACAA CCTAAACCTA 
AAGCGTGTAT CTGCTCCCCT ATTCGTTTCA GAAACATCAG GTCTTAACGA TAACCTAAAC 
GGAGTAGAAA AACCTGTAAC CTTCGACCTT CCAGAAGCTC ACAACGCCGA GATGGAAATC 
GTCCACTCCC TTGCCAAATG GAAGAGATAC GCCCTAGAAG AATACAACTT CAAAACCCAC 
GAGGGCCTTT ACACAGACAT GAACGCCATA AGACGCTGCG AAGAACCAGA CAACACCCAC 
TCCTTCTACG TCGACCAATG GGACTGGGAA CTAATCATGA ATGAAGAAGA CAGAAACGTG 
GACTACCTCA AACAAATCGT AGAAACAATC TACAGGACTA TGAAATCCCT AGACGAATAC 
CTCTGCACTC TTATTCCAAC TAGACAAAAG CTCCTCAAAG ATCAAATTAG ATTTATGACA 
AGCGAAGAGC TCCTCCAAAA ATATCCAGGC AAAAACGATA AGGAAAGAGA AAGATTAGCG 
GTCAAAGAAT ACGGAGCAGT TTTCCTAATG CAAATAGGAA AAGTCCTATC AAACGGAGAA 
AAACACGACC TCCGTGCCCC AGACTACGAC GATTGGGAAC TAAACGGGGA CATCCTTGTA 
TATAACCCTG TACTAGACGA TGTCCTAGAA CTATCATCCA TGGGCATCAG AGTCAACCCA 
GAAAGACTAA ACGAGCAACT AAAACAAACA GACAACCTAG ACAGACTAAA ATTCGACTAC 
CACAGGATGC TAATAGACGG CAAACTCCCA CAAACCATAG GAGGCGGAAT CGGCCAATCA 
AGACTATGTA TGTTCTTCCT CCAAAAAGCC CACATAGGAG AAGTCCAAGT ATCCTACTGG 
CCAGACGAAC AAAGAAAAGC TCTAGCCAAC AAGGGAATCA AACTATTATA G

Protein sequence

MSKLVIPENY KSNEDLYRTQ LLIKEIKDYF QINLANNLNL KRVSAPLFVS ETSGLNDNLN 
GVEKPVTFDL PEAHNAEMEI VHSLAKWKRY ALEEYNFKTH EGLYTDMNAI RRCEEPDNTH 
SFYVDQWDWE LIMNEEDRNV DYLKQIVETI YRTMKSLDEY LCTLIPTRQK LLKDQIRFMT 
SEELLQKYPG KNDKERERLA VKEYGAVFLM QIGKVLSNGE KHDLRAPDYD DWELNGDILV 
YNPVLDDVLE LSSMGIRVNP ERLNEQLKQT DNLDRLKFDY HRMLIDGKLP QTIGGGIGQS 
RLCMFFLQKA HIGEVQVSYW PDEQRKALAN KGIKLL