Gene Shewmr4_2020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2020
Symbol
ID	4252593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	2404520
End bp	2405713
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	47%
IMG OID	638118633
Product	aromatic amino acid aminotransferase
Protein accession	YP_734150
Protein GI	113970357
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1448] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00317803
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00000201349
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTTTCT CTCAGGTAGT ACTCGCACCC GCTGATCCCA TCCTTGGTTT AACCGATACC 
TTCAAGGCCG ATCCACGCCA AGATAAAGTG AACCTCGGTG TTGGCATTTA TAAGGATGAA 
GCAGGGCAGA CTCCAGTATT ACAGTCAGTG AAGAAAGCAG AAGCCCTATT GCTTGAGCAA 
GAGAAGACCA AGAACTATTT AGGTATTGAA GGGGTTCAAA CCTATAACCG CGTGGTACAA 
GAGCTATTAT TTGGCGAGGG CAGTACGCTT GTGACGTCAG GCCGTGCCGC GACCGCTCAG 
GCGCCAGGTG GTACTGGTGC ACTGCGTATT GCCGCCGAGT TTCTACTGCG CAACACGCCA 
TCGCGCACTG TGTGGGTCAG TAACCCAACT TGGGCGAACC ATCAGAATAT TTTTGAAACT 
GCAGGTTTAA CGGTTAAAGA ATACGGTTAC TACAATGCAA GTGCTCACGA TATCGATTTC 
GATGGCATGA TGACTGATCT CGCCAATGCA CAGGCGGGTG ACATTGTTCT ACTGCACGGC 
TGCTGCCATA ACCCAACGGG TATTGATTTG ACCTTAGCCC AATGGGAATT GGTTGCTAAC 
CTGTGTGCAG ACAAACAGTT AGTGCCATTG TTTGACTTTG CTTACCAAGG TTTTGGTGCT 
GGGATTGAAG AAGATGCCGC AGGTTTACGT TTAGTGGCTG CAAAAGTACC TGAGTTGTTA 
GTGGCTAACT CATTCTCTAA AAACTTTGGT CTTTATAACG AGCGTATCGG TGCTGTGACT 
GTGGTTGCAC AAAATGCCGA TGAAGCAGTA CGTGCCTTTA GCCAAGTGAA ACGTACTATC 
CGCGCTAATT ACTCAAACCC ACCAGCACAC GGTGCGTTAA TCGTTAGCAC CATTTTAAGT 
GATGCGGCAT TGAAAGCACT TTGGGTACAA GAGTTGACCG AAATGCGTGA GCGTATCGCC 
GAGATGCGTA CCCTGTTCGT CCAAAGCTTA AAGGATGAAG GCGTCACCCA GGACTTTAGC 
TTTATTTCCC GTCAAAACGG TATGTTTAGC TTCTCTGGTT TAAACAAAGC GCAGGTTGCA 
CGCTTGAAAG ACGAGTTTGG TATTTATATC GTAGGCTCAG GCCGTATTAG TGTTGCCGGT 
ATGACCAAAA CCAATATGCC TGTGATCTGT AAAGCGATTG CCCAGGTTCT TTAA

Protein sequence

MIFSQVVLAP ADPILGLTDT FKADPRQDKV NLGVGIYKDE AGQTPVLQSV KKAEALLLEQ 
EKTKNYLGIE GVQTYNRVVQ ELLFGEGSTL VTSGRAATAQ APGGTGALRI AAEFLLRNTP 
SRTVWVSNPT WANHQNIFET AGLTVKEYGY YNASAHDIDF DGMMTDLANA QAGDIVLLHG 
CCHNPTGIDL TLAQWELVAN LCADKQLVPL FDFAYQGFGA GIEEDAAGLR LVAAKVPELL 
VANSFSKNFG LYNERIGAVT VVAQNADEAV RAFSQVKRTI RANYSNPPAH GALIVSTILS 
DAALKALWVQ ELTEMRERIA EMRTLFVQSL KDEGVTQDFS FISRQNGMFS FSGLNKAQVA 
RLKDEFGIYI VGSGRISVAG MTKTNMPVIC KAIAQVL