Gene CNF03990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CNF03990
Symbol
ID	3258485
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cryptococcus neoformans var. neoformans JEC21
Kingdom	Eukaryota
Replicon accession	NC_006691
Strand	-
Start bp	1157222
End bp	1160051
Gene Length	2830 bp
Protein Length	681 aa
Translation table
GC content	47%
IMG OID	638257517
Product	vesicle-mediated transport-related protein, putative
Protein accession	XP_571358
Protein GI	58268404
COG category	[R] General function prediction only
COG ID	[COG1100] GTPase SAR1 and related small G proteins
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.294872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GGACATAAGC TACGTCCCGG TATCAAGTTC TCCTCAGCAG ATACCCCTGA TCGATACAAA 
AAGCACCTCG CAACATCGCT TAACACTTCT GATCAGCATT GTCGCCCGGA ATGCCCCGAC 
GTGACTTGGT TCGCATTGTG CTGGTTGGAG ATGGTCAGTA ACTGCTTTTA CGACAGGTTA 
GATAGACAGC TCGGAATAGA GTATGCTGAC AATACCCTTC TGTGTAGATG GCGTCGGAAA 
GTCATCTATC ATCACTTCGC TCATCAAAGA AGCATTCGTC ACAAATGTCC GTTCGCCGGC 
CTTTCCGCAG TGTTTGCACA AAACTGACTT GCTACAGGTA CCACATGTTG TCCCAGAAGT 
GACCATTCCA CCAGAAATAA CACCGGAGAA CTTTACAACC TCTATCGTCG ATACCTCTTG 
TATGCTTCTT TCCATTGAAC TCCTTGAAAC ACAGCAGCTA ATTGGAGAAC CATCATAGCG 
AACCCAAGGT CGAGGCCACA CCTTCTCAGC TCTATATCCC GAGCCCATGT CATTTGCTTG 
GTCTATTCTA TTGCCGATCC AAGCTCCTTC GATCGGGTAG CAGAGTATTG GTTGCCGTTG 
TTCAGAAGAG AGGGTATCAA TGTACGTTGC CCAGTTGATT GCTAGGTGAC GCAGGCTGAT 
GAATATCCCA GGTCCCTGTC ATTCTTGTTG GCAACAAGAT CGACTTACGT GGTGGAAGGG 
TCACCAACCA AGGGTTAGAG GATGAAAGTG CGCCGATCAT GCGCGAATTC AAAGTGCGCC 
GCATTTTGCT TGCGAGGAGT TAGAGCTAAC TTCTCTCGTA TTATAGGAAG TGGAGACAGT 
TGTGGAGTGT TCCGCTTTAC TGCCTCTCAA CGTTTCGGAA GTCTTTTATT TCGCTCAGAA 
GGCTGTTTTA CACCCCACTG CCCCCCTTTA TGATTCCCGA GAACATGTAA ATTACCATAT 
TTCTTTGCCG TGATTGGCTG AGCTAATTTT TTAGACCTTG AAACCCAAAT GCCTGGAAGC 
GTTAAAGCGA ATATTCACCA TTTCTGATGT AGACAAGGAC GGTCTTCTCA ATGCTCACGA 
GCTGAACCAA TTCCAAGTAA GTGACTCTTA ATTCCATATT CAGCAGCTGA TAGTTGCGTA 
GCAAAAATGT TTCTCTACAC CTCTTCAATC CCAAGAACTT GATGGCATTC TCGAAATTGT 
CCGATCTTAT GATCCTTACG CAGTCCAACC CCTTCCCTCC TCCTCTCCCA ACACCCCTCT 
ATCTCGTGAT TCTTCATATG GCCAATTACA TTATTTCAAC AACAATGTCG TCCCGCCTTC 
TCCTCCTCAA GAGGGCATAA CGGAGCTCGG TTTCTTGTAC CTGCATACAA TGTTCATTCA 
GCAAGGAAGA ATGGAGACTA CATGGACAGT TCTAAGGAAG TTTGGTTATG GGGAGAGTCT 
GGATTTGAGA GAGGACTTTT TGGCCCCAAA GTTCGATGTG CCGTCCGATT GCTCGGTAGA 
ATTGAGTCCA TTGGGTAACC AGTTCTTGAC GGACATCTTT GAGGCATATG ACAAGGTAAA 
TCTAAAAAAA TTGGTAGTAT GAAAGATCCC AGCTGAGGTC AAAATTTAGG ATCAAGATGG 
AGCTCTTTCT CAGAATGAGC TTGACGACCT TTTCTCAACA TCTCCTGGGA ATCCATGGCT 
TTCACAAGGC TTTCCTGACA CGACCATTAC GGACGATATG GGTAGAGTCA CGCTCCAGGG 
ATGGTTAGCG CAATGGAGGT AAGTGTCAAA AATGTGAGAA CTGGCCCATT TGACCATTTG 
TAGTATGACA ACGCTTCTCA ACCACCGTAC GACGCTTAAC TACCTCGCCT AGTGAGTAGC 
TATGCGGTTT TGACTGTTGG GATGTCAACT GACTCTATTT AGCCTCGGAT ACTCTTCCTC 
TCCCGCCACC GATCTTCCTA CTCCCACAGC CCTCCATGTC ACTCGTCCAC GTAAACAGGA 
CCGGCGCCAA CGCAAAGTCA CCCGCAATGT CTTTTTGTGC TATGTTTTGG GTGCTACTGG 
CTCCGGTAAG ACTAGCTTGT TACGCTCGTT TGTAAACAGA CCGTTCAAAG GTGGTGAGGA 
TGGTTTGGGG GGGTATGAGC CAACAACGAA GGTATTGAGT GTCGTGAATT CTGTTGAAAT 
GGAGGGCGTG GAGAAGTACT TGGTCGTAAG TGACGCATTT TTCGTACAGA GAGGTTTTGA 
GAGCTGATAA TGATCTTTTA GTTGCAAGAA TTTGGGTCAA AGTATGAGAG TGAAATATTA 
CGAAATAGTA AACGATTGGA TATGGCAGAT ATCATTATTT ACGTTCACGA TTCAAGTGAT 
ACAAACTCCT TCTCCTACAT TTCCAATCTT CGAGTGAGTT TAACCGACTT CAATATTGAA 
TTTTGCGATG CTCACCTCGG GATAGCAACA GTATTCTTTA GATCATATCC CTTCCATATT 
TGTGGCTACC AAATCCGATC TCGATTTAGC TCAGCAACGG CACGAAGTCC AACCCGATGT 
CTACTGCCGC CGTCTGGGCC TCCAGGCACC CATGGCCGTG TCTTCCCGAT TAGGACCTCT 
ACACAATCTC TGGGTAGCCA TTACTCGTGT CGCCCTTGAT CCCACATCAT CCCTTCCTCG 
CGGGCCGAGA TCGCAAATGT CACCTGCCCA GAGGATACGG GTGGTTGCCC GTTGGGGTTT 
GGCAGCGACA ACGATTAGCG CGATCGTGGC TGTGTGGATG AAGTGGCAGG GATATAGCTT 
CAAGGGTATA TGGGGCTGGA TGGCCAAATT TGCTGGGTTA AGAACATGAT AGAGCATGAT 
CCGGTTACCA

Protein sequence

MPRRDLVRIV LVGDDGVGKS SIITSLIKEA FVTNVPHVVP EVTIPPEITP ENFTTSIVDT 
SSNPRSRPHL LSSISRAHVI CLVYSIADPS SFDRVAEYWL PLFRREGINV PVILVGNKID 
LRGGRVTNQG LEDESAPIMR EFKEVETVVE CSALLPLNVS EVFYFAQKAV LHPTAPLYDS 
REHTLKPKCL EALKRIFTIS DVDKDGLLNA HELNQFQQKC FSTPLQSQEL DGILEIVRSY 
DPYAVQPLPS SSPNTPLSRD SSYGQLHYFN NNVVPPSPPQ EGITELGFLY LHTMFIQQGR 
METTWTVLRK FGYGESLDLR EDFLAPKFDV PSDCSVELSP LGNQFLTDIF EAYDKDQDGA 
LSQNELDDLF STSPGNPWLS QGFPDTTITD DMGRVTLQGC MTTLLNHRTT LNYLAYLGYS 
SSPATDLPTP TALHVTRPRK QDRRQRKVTR NVFLCYVLGA TGSGKTSLLR SFVNRPFKGG 
EDGLGGYEPT TKVLSVVNSV EMEGVEKYLV LQEFGSKYES EILRNSKRLD MADIIIYVHD 
SSDTNSFSYI SNLRQQYSLD HIPSIFVATK SDLDLAQQRH EVQPDVYCRR LGLQAPMAVS 
SRLGPLHNLW VAITRVALDP TSSLPRGPRS QMSPAQRIRV VARWGLAATT ISAIVAVWMK 
WQGYSFKGIW GWMAKFAGLR T