Gene Aasi_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1038
Symbol
ID	6376895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1343536
End bp	1344999
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	34%
IMG OID	642682154
Product	hypothetical protein
Protein accession	YP_001958115
Protein GI	189502398
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTATT TCAGTACTGA TGCCATCATT GTATATGCCT TTTTATTCAT AACCTTAGCA 
GTAGGATTAT GGGCAGGAAG AAATGTAAAG TCTATTAAAG AATATGCAAT TGCTAATAGG 
ACTTATGGAA CAGGGGTACT TACGATAACC ATGTTGGCTA CTTATCTTAC TGGTTCTCAG 
GCTATAGGTT ATGCAGGCCA TGTTTTTGAT AATGGTGTAT TTTTCCCTTT TATTACAAGA 
GTTTTCTGTG GTGTTATTAT ATGCTTTTTG TTTATTGCAC GTTACATAGC GCCAAAAATG 
TATCGTTTTG CAGGATGTTT GACATTGGCA GAAATAATGG GGAAACTATA TGGTCCTAAA 
GTACGTATAT GGATCGGCAT TCTAGGAACT TTATATTCTC TAATCATGGT TACGCTACAA 
ATTATCTGGT TGGGCTATAT AGGGGACTTC ATTAATATTC CTAGTCAGTG GAGTATTTTC 
TTAGGAGGAG TTTTTTTAAT GTTTTATGCT AGCAGAGGAG GCATGAAAGC TGTAGCTATC 
ACAGATATAT TACAATTTGT TGCCATTACT ATACTGATAC CTTTAGCCGC TAATGTCTTA 
TTGCATAGAT TTGATGGAAT AAGAGATATG TTTACTCACG TTCCATCCGA AAATTTTAAT 
TTCTTTCAAC ATCTGAATAT AAATGAATTC TTGATTCCTT TTTTATGGTA CCTCTTCCCT 
GCTTTTCCAC TTAGCTTCCC ATTCATGCAA CGTATGCTCA TGGCAAAGGA CACGCGCCAA 
ATAGCTAATA GCCATTATAT AGCTACATTT TATTTAATAG GGTTTTATCT ATTACTTACT 
TTTATTGGTC TAGCAGCTAT AGCTTTAAAA ACAATGGGAG ATGTAAATAT TCCACACCAG 
GGTAGTAAGA TATTTATATA TTTGGTTAAA ACATATTTTC CAGTAGGCAT CAAAGGCATA 
GTAGGTATCG GATTGTTAGC AGCTGTTATG TCTACGGCAG ACTCTTTCCT GCATAGTGCA 
GGTATGCTAG TAGCACATGA TGTAATTGGA CCTTTACTGC AAACAAAAAA AACTAAAATT 
GATGTTTTAA AAATAAGTCA ATACGCAACA TTTTCTCTTG GCTTAATAGC TTTTTGCATA 
GCATTAAGTT ATCAATCATT GCCTCGTATA CTGTATGGAG ATATACATTG GGGTAAAGGG 
ATAAATATAT TTAGGGATTT TGTAGCGATC GTATTTACTA TTCCTATGAT AGCGGGTATC 
ATGGGCTTAA AAACGGATGC TAAGTCTTTT TTTATTTCGT TAATAGCTAC TTGTATTACC 
TTTTTTATAG GAAAATTATT TTTATCAGAT TTATGGTTTA TGCCTGTTAC CATTATAATT 
AATGCGGTGA GCTTTTTTGG GGCGCATTAT CTACAAAATA AAGGGTTTTT AACTGTAAAA 
AGAGATGAAA TATTAGTAAC TTAA

Protein sequence

MNYFSTDAII VYAFLFITLA VGLWAGRNVK SIKEYAIANR TYGTGVLTIT MLATYLTGSQ 
AIGYAGHVFD NGVFFPFITR VFCGVIICFL FIARYIAPKM YRFAGCLTLA EIMGKLYGPK 
VRIWIGILGT LYSLIMVTLQ IIWLGYIGDF INIPSQWSIF LGGVFLMFYA SRGGMKAVAI 
TDILQFVAIT ILIPLAANVL LHRFDGIRDM FTHVPSENFN FFQHLNINEF LIPFLWYLFP 
AFPLSFPFMQ RMLMAKDTRQ IANSHYIATF YLIGFYLLLT FIGLAAIALK TMGDVNIPHQ 
GSKIFIYLVK TYFPVGIKGI VGIGLLAAVM STADSFLHSA GMLVAHDVIG PLLQTKKTKI 
DVLKISQYAT FSLGLIAFCI ALSYQSLPRI LYGDIHWGKG INIFRDFVAI VFTIPMIAGI 
MGLKTDAKSF FISLIATCIT FFIGKLFLSD LWFMPVTIII NAVSFFGAHY LQNKGFLTVK 
RDEILVT